Om AI innebär lika stor förändring som den industriella revolutionen så underskattar många förändringen vi står inför

Yes verkligen. Det är här blockkedjor kommer in i bilden.

2 gillningar

Finns inget sätt du kan säga om en bild är äkta utan att de kan göra samma sak med AI bilder.

Säg att du har en kryptonyckel i varje kamera som med bilden gör en checksumma. De som vill kan alltid komma åt nyckeln i kameran och göra samma sak med AI bilder (Se hur de knäcker konsoler tex). Enklare ändå skulle vara att du helt enkelt tar en bild på en annan bild med kameran. Är bilden äkta eller oäkta då? Sen ska du reda ut vad äkta är som allt är eniga med. Får kameran ändra färgerna i bilden för att den ska anses äkta? Ändra leenden lite om det sker i kameran? Osv.

Det är ett slag vi omöjligen kan vinna. Så blir nog till att dessvärre anta att allt du är ser är oäkta. Sen blir det vissa källor man får lita mer på än andra.

2 gillningar

Det jag har efterlyst ett tag är någon form av “omvänt bankid” där jag som privatperson kan be andra personer eller organisationer att identifiera sig. Det hade kunnat motverka en rad bedrägerier och annat. En tanke jag har slagits av är att be folk att swisha 1 kr som ett sätt att verifiera vem de är, men folk är lite skeptiska…

1 gillning

Alltid galet när man tittar på hur fort det går med AI video det senaste 1-2 åren :exploding_head:

https://x.com/ai_for_success/status/1822116886126961095

Jag har testat lite små modeller och kommit fram till att Llama 8B trots allt är snäppet sämre än de flesta stängda små varianterna.

Llama:

Jämfört med:



2 gillningar

Intressant läsning om hur man bygger bättre AI för robotar :robot:

https://www.perplexity.ai/page/mit-s-algorithm-for-self-train-Lewzl1W_RfusEK8Lpd6VTw

2 gillningar

Mamba ser ut att ännu en gång leverera :train2: ny öppen 7B modell :sunglasses:

https://x.com/reach_vb/status/1823006622773395898

1 gillning

En länk för er som vill se några av förra veckans framsteg inom robotar :robot:

https://x.com/adcock_brett/status/1822665031714001062

Det tycks som att självkörande taxi växer i Usa, i denna takten kanske de täcker större delen av Usa inom 10 år :taxi:

En teknisk artikel om hur man ska kunna få mer effektiv användning av minnet i grafikkort med Transformers, nice att se att det fortfarande finns utrymme för optimeringar med nuvarande algoritmer :sunglasses:

1 gillning

Är det inte det som är främsta funktionen med klarna, rocker etc.?
Framförallt vid transaktioner, men rocker har ju även avtalssignering.
Adobe har ju liknande i sin pro med digital signatur som kan kräva verifiering. Det är ju inte riktigt samma, men det är ju inte långt bort.

1 gillning

Morgonen börjar med att någon påstår sig att de har en AI agent för forskning…

Här är hur det funkar :sunglasses:

4 gillningar

Samma dag som några forskare säger sig ha en AI agent som kan göra forskning så hävdar andra forskare att LLMs inte kan skapa något nytt eller lösa problem som inte finns i deras träning data. Debatten lär fortsätta :popcorn:

1 gillning

Det tycks som Grok 2 är på gång, kommer från X/Twitter. Ska bli spännande och se resultatet :sunglasses:

https://x.com/nima_owji/status/1823388838279922166

Idag fortsätter att leverera, Google har ett event och visar upp nästa steg för Gemini :sunglasses:

https://x.com/GoogleDeepMind/status/1823409674739437915

1 gillning

Eftersom OpenAI inte kan låta Google ha en bra dag har de släppt lite nyheter om SWE-bench :popcorn:

https://openai.com/index/introducing-swe-bench-verified/

Har du testat att du får lika bra svar som om du kör direkt? Har testat ett par andra “agregators” och ibland upplevt att jag fått lite sämre svar den vägen än om jag gått direkt mot samma motor, men jag har eg ingenting konkret att hänga upp det på. Och hur är det med stöd för specifika saker som artefakter hos Claude osv?

Dags för AIn som testar AIn eller finns det redan? :slight_smile:

Ännu mer jag nyss såg, detta ser ut att faktiskt vara något stort :train2:

Från deras abstrakt, de har en teknik som gör modeller betydligt smartare :exploding_head:

Remarkably, rStar boosts GSM8K accuracy from 12.51% to 63.91% for LLaMA2-7B, from 36.46% to 81.88% for Mistral-7B, from 74.53% to 91.13% for LLaMA3-8B-Instruct.

Nu har jag i princip bara testat för GPT-4 och där märker jag inte att Poe skulle vara sämre än ChatGPT.

Det tror jag inte, i så fall har jag missat det :face_with_peeking_eye: så det beror så klart på om det är någon specifik funktion man använder som gör att man hellre vill ha den plattformen :slightly_smiling_face:

Edit:
Jag såg nyss på live bench som jämför modeller att GPT-4 via api är hyfsat bättre än via ChatGPT :thinking:

Lite info börjar jobba om Grok 2, ser ut som Elon har lyckats skapa något i samma nivå som GPT-4 :sunglasses:


Själv tycker jag Grok 2 mini ser spännande ut.