Llama (modello linguistico)

Llama; software
Genere	Chat bot
Sviluppatore	Meta Platforms
Ultima versione	3.1 (23 luglio 2024)
Sistema operativo	Multipiattaforma
Linguaggio	Python
Licenza	Meta Llama 3 Community License; (licenza non libera)
Lingua	Multilingua
Sito web	llama.meta.com/
	Modifica dati su Wikidata · Manuale

Llama (acronimo di Large Language Model Meta AI, e precedentemente stilizzato come LLaMA) è una famiglia di modelli linguistici autoregressivi di grandi dimensioni (LLM) rilasciati da Meta AI a partire da febbraio 2023. L'ultima versione è Llama 3.1, rilasciata nel luglio 2024.^[1]

I pesi del modello per la prima versione di Llama sono stati resi disponibili alla comunità di ricerca con una licenza non commerciale e l'accesso è stato concesso caso per caso.^[2] Copie non autorizzate del modello sono state condivise via BitTorrent. In risposta, Meta AI ha emesso richieste di rimozione DMCA contro i repository che condividevano il link su GitHub.^[3] Le versioni successive di Llama sono state rese accessibili al di fuori del mondo accademico e rilasciate con licenze che consentivano un certo uso commerciale.^[4]^[5] I modelli di Llama sono addestrati con parametri di dimensioni diverse, comprese tra 7B e 405B. In origine, Llama era disponibile solo come modello fondativo. A partire da Llama 2, Meta AI ha iniziato a rilasciare versioni perfezionate delle istruzioni accanto ai modelli di base.^[6]^[7]

Parallelamente al lancio di Llama 3, Meta ha aggiunto la funzionalità di assistente virtuale a Facebook e WhatsApp in alcune regioni del mondo selezionate, nonché un sito web autonomo. Entrambi i servizi utilizzano un modello Llama 3.^[8]

Confronto dei modelli

[modifica | modifica wikitesto]

Nella colonna dei costi di formazione viene riportato solo il costo del modello più esteso. Ad esempio, "21.000" è il costo di addestramento di Llama 2 cioè 69B in unità di petaFLOP per giorno. Inoltre, 1 petaFLOP-giorno = 1 petaFLOP/sec × 1 giorno = 8,64E19 FLOP.

Nome	Data di rilascio	Parametri	Costo della formazione (petaFLOP-giorno)	Lunghezza del contesto	Dimensione del corpus	Sostenibile commercialmente?
Llama	24 febbraio 2023	6,7 miliardi 13B 32,5 miliardi 65,2 miliardi	6.300 ^[9]	2048	1–1,4 T	No
Llama 2	18 luglio 2023	6,7 miliardi 13B 69B	21.000 ^[10]	4096	2T	Si
Codice Llama	24 agosto 2023	6,7 miliardi 13B 33,7 miliardi 69B		4096	2T
Llama 3	18 aprile 2024	8B 70,6 miliardi	100.000 ^[11] ^[12]	8192	15T
Llama 3.1	23 luglio 2024	8B 70,6 miliardi 405B	440.000 ^[13] ^[14]	128.000	15T

Applicazioni

[modifica | modifica wikitesto]

Il Center for Research on Foundation Models (CRFM) dell'Institute for Human-Centered Artificial Intelligence (HAI) dell'Università di Stanford ha rilasciato Alpaca, una soluzione di addestramento basata sul modello LLaMA 7B che utilizza il metodo “Self-Instruct” di messa a punto delle istruzioni per acquisire capacità paragonabili al modello OpenAI GPT-3 della serie text-davinci-003 a un costo modesto.^[15]^[16] I file del modello sono stati ufficialmente rimossi il 21 marzo 2023, a causa dei costi di hosting e di problemi di sicurezza, sebbene il codice e il documento sono rimasti online come riferimento.^[17]^[18]

Meditron è una famiglia di strumenti basati su Llama, perfezionati su un corpo di linee guida cliniche, articoli e documenti PubMed. È stato creato dai ricercatori della Facoltà di Informatica e Scienze della Comunicazione dell'École Polytechnique Fédérale di Losanna e della Facoltà di Medicina della Yale. Mostra prestazioni migliorate nei benchmark correlati alla medicina come MedQA e MedMCQA.^[19]^[20]^[21]

Zoom ha utilizzato Meta Llama 2 per creare un'intelligenza artificiale in grado di riassumere le riunioni, fornire utili suggerimenti per presentazioni e fare da assistente nelle risposte ai messaggi. Questo assistente AI è alimentato da più modelli, tra cui Meta Llama 2.^[22]

Note

[modifica | modifica wikitesto]

^ (EN) ai.meta.com, https://ai.meta.com/blog/meta-llama-3-1/ Titolo mancante per url url (aiuto). URL consultato il 23 luglio 2024.
^ Meta heats up Big Tech's AI arms race with new language model, su reuters.com, Reuters, 25 February 2023.
^ github/dmca - Notice of Claimed Infringement via Email, su github.com, GitHub, 21 March 2023.
^ (EN) Meta's AI research head wants open source licensing to change, su theverge.com, 30 October 2023.
^ Meta and Microsoft Introduce the Next Generation of LLaMA, su about.fb.com, 18 July 2023.
^ Meta and Microsoft Introduce the Next Generation of LLaMA, su about.fb.com, 18 July 2023.
^ Meta, https://about.fb.com/news/2023/07/llama-2/ Titolo mancante per url url (aiuto). URL consultato il 21 July 2023.
^ Meta, https://about.fb.com/news/2024/04/meta-ai-assistant-built-with-llama-3/ Titolo mancante per url url (aiuto).
^ huggingface.co, https://huggingface.co/blog/falcon Titolo mancante per url url (aiuto). URL consultato il 20 giugno 2023.
^ (EN) GitHub, https://github.com/meta-llama/llama/blob/main/MODEL_CARD.md Titolo mancante per url url (aiuto). URL consultato il 28 maggio 2024.
^ Andrej Karpathy (Apr 18, 2024), The model card has some more interesting info too
^ (EN) GitHub, https://github.com/meta-llama/llama3/blob/main/MODEL_CARD.md Titolo mancante per url url (aiuto). URL consultato il 28 maggio 2024.
^ DOI:10.48550/arXiv.2407.21783, http://arxiv.org/abs/2407.21783.
^ (EN) GitHub, https://github.com/meta-llama/llama-models/blob/main/models/llama3_1/MODEL_CARD.md Titolo mancante per url url (aiuto). URL consultato il 23 luglio 2024.
^ crfm.stanford.edu, https://crfm.stanford.edu/2023/03/13/alpaca.html Titolo mancante per url url (aiuto).
^ crfm.stanford.edu, https://crfm.stanford.edu/2023/03/13/alpaca.html Titolo mancante per url url (aiuto).
^ (EN) www.theregister.com, https://www.theregister.com/2023/03/21/stanford_ai_alpaca_taken_offline/ Titolo mancante per url url (aiuto).
^ (EN) Gizmodo, https://gizmodo.com/stanford-ai-alpaca-llama-facebook-taken-down-chatgpt-1850247570 Titolo mancante per url url (aiuto).
^ (EN) ai.meta.com, https://ai.meta.com/blog/llama-2-3-meditron-yale-medicine-epfl-open-source-llm/ Titolo mancante per url url (aiuto).
^ (EN) actu.epfl.ch, https://actu.epfl.ch/news/epfl-s-new-large-language-model-for-medical-knowle/ Titolo mancante per url url (aiuto).
^ github.com, https://github.com/epfLLM/meditron Titolo mancante per url url (aiuto).
^ Meta, https://about.fb.com/news/2024/05/how-companies-are-using-meta-llama/ Titolo mancante per url url (aiuto).

Collegamenti esterni

[modifica | modifica wikitesto]

(EN) Sito ufficiale, su llama.meta.com.
Repository sorgenti di Llama (modello linguistico), su github.com.

Portale Informatica

Portale Internet

Estratto da "https://it.wikipedia.org/w/index.php?title=Llama_(modello_linguistico)&oldid=141013488"

[llama31blog-1] (EN) ai.meta.com, https://ai.meta.com/blog/meta-llama-3-1/ Titolo mancante per url url (aiuto). URL consultato il 23 luglio 2024.

[2] Meta heats up Big Tech's AI arms race with new language model, su reuters.com, Reuters, 25 February 2023.

[githubdcma2-3] thub/dmca - Notice of Claimed Infringement via Email, su github.com, GitHub, 21 March 2023.

[4] (EN) Meta's AI research head wants open source licensing to change, su theverge.com, 30 October 2023.

[llama2blog2-5] Meta and Microsoft Introduce the Next Generation of LLaMA, su about.fb.com, 18 July 2023.

[llama2blog3-6] Meta and Microsoft Introduce the Next Generation of LLaMA, su about.fb.com, 18 July 2023.

[llama2blog-7] Meta, https://about.fb.com/news/2023/07/llama-2/ Titolo mancante per url url (aiuto). URL consultato il 21 July 2023.

[8] Meta, https://about.fb.com/news/2024/04/meta-ai-assistant-built-with-llama-3/ Titolo mancante per url url (aiuto).

[:5-9] uggingface.co, https://huggingface.co/blog/falcon Titolo mancante per url url (aiuto). URL consultato il 20 giugno 2023.

[10] (EN) GitHub, https://github.com/meta-llama/llama/blob/main/MODEL_CARD.md Titolo mancante per url url (aiuto). URL consultato il 28 maggio 2024.

[11] Andrej Karpathy (Apr 18, 2024), The model card has some more interesting info too

[12] (EN) GitHub, https://github.com/meta-llama/llama3/blob/main/MODEL_CARD.md Titolo mancante per url url (aiuto). URL consultato il 28 maggio 2024.

[:0-13] DOI:10.48550/arXiv.2407.21783, http://arxiv.org/abs/2407.21783.

[14] (EN) GitHub, https://github.com/meta-llama/llama-models/blob/main/models/llama3_1/MODEL_CARD.md Titolo mancante per url url (aiuto). URL consultato il 23 luglio 2024.

[15] rfm.stanford.edu, https://crfm.stanford.edu/2023/03/13/alpaca.html Titolo mancante per url url (aiuto).

[16] rfm.stanford.edu, https://crfm.stanford.edu/2023/03/13/alpaca.html Titolo mancante per url url (aiuto).

[17] (EN) www.theregister.com, https://www.theregister.com/2023/03/21/stanford_ai_alpaca_taken_offline/ Titolo mancante per url url (aiuto).

[18] (EN) Gizmodo, https://gizmodo.com/stanford-ai-alpaca-llama-facebook-taken-down-chatgpt-1850247570 Titolo mancante per url url (aiuto).

[19] (EN) ai.meta.com, https://ai.meta.com/blog/llama-2-3-meditron-yale-medicine-epfl-open-source-llm/ Titolo mancante per url url (aiuto).

[20] (EN) actu.epfl.ch, https://actu.epfl.ch/news/epfl-s-new-large-language-model-for-medical-knowle/ Titolo mancante per url url (aiuto).

[21] thub.com, https://github.com/epfLLM/meditron Titolo mancante per url url (aiuto).

[22] Meta, https://about.fb.com/news/2024/05/how-companies-are-using-meta-llama/ Titolo mancante per url url (aiuto).

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

Llama (modello linguistico)

Indice

Confronto dei modelli

Applicazioni

Note

Collegamenti esterni

Menu di navigazione

Llama (modello linguistico)

Confronto dei modelli

Applicazioni

Note

Collegamenti esterni

Menu di navigazione

Ricerca