A LlaMA 2 a Microsoft és a Meta által létrehozott új mesterséges intelligencia modellek készlete
A Meta és a Microsoft együttműködve elindította a LLaMA 2-t, egy olyan nyelvi modellt, amely nyílt forráskódú lesz. Lehetővé teszik a fejlesztők és szervezetek számára, hogy mesterséges intelligencia által vezérelt generatív eszközöket hozzanak létre. Az Inspire 2023 rendezvényen a Microsoft bejelentette a modell megjelenését, hangsúlyozva közös elkötelezettségüket az AI demokratizálása mellett.
A Meta vezérigazgatója, Mark Zuckerberg további részletekkel szolgált, kifejtve, hogy a LLaMA 2-t 40%-kal több adattal betanították, mint elődjét, és továbbfejlesztett architektúrával büszkélkedhet. A modell felügyelt finomításon és visszacsatolás megerősítésen esett át a biztonság és a minőség javítása érdekében.
A LLaMA 2 kutatási és kereskedelmi használatra lesz elérhető, és olyan platformokon is tesztelhető lesz, mint a Microsoft Azure, az Amazon Web Services és a Hugging Face. A partnerség célja, hogy felvegye a versenyt az OpenAI ChatGPT-jével, és tovább mozdítsa a mesterséges intelligencia fejlesztését.
Februárban Mark Zuckerberg bemutatta a LLaMA modellt. Kijelentette, hogy az új „LLM ígéretesnek bizonyult a szövegalkotásban, a párbeszédben, az írott anyagok összefoglalásában és a bonyolultabb előadásokban. olyan feladatok, mint a tételek bizonyítása vagy a fehérje szerkezetének előrejelzése." Az LLaMA nem egyetlen rendszer, hanem különböző modellek "kvartettje" méretek. Négy változatban kapható: LLaMA-7B, LLaMA-13B, LLaMA-33B és LLaMA-65B, ahol a számok a paraméterek számát jelzik - 7, 13, 33 és 65 milliárd.
Forrás
Ha tetszett a cikk, kérjük, ossza meg az alábbi gombok segítségével. Tőled nem vesz el sokat, de segít nekünk a növekedésben. Köszönet a támogatásodért!