PaLM (Pathways Language Model) — Google AI tərəfindən hazırlanmış 540 milyard parametrli transformator əsaslı böyük dil modeli. Tədqiqatçılar həmçinin model miqyasının təsirlərini yoxlamaq üçün PaLM-in daha kiçik versiyalarını, 8 və 62 milyard parametrli modellərini yaradıblar.
PaLM | |
---|---|
Tipi | böyük dil modeli |
Tərtibatçı | Google AI |
Sayt | |
Vikianbarda əlaqəli mediafayllar |
PaLM, sağlam düşüncə, arifmetik əsaslandırma, zarafat izahı, kod yaratmaq və tərcümə də daxil olmaqla, geniş spektrli tapşırıqları yerinə yetirməyə qadirdir. Düşüncə zənciri ilə birləşdirildikdə, PaLM söz problemləri və məntiqə əsaslanan suallar kimi çoxsaylı addımların əsaslandırılmasını tələb edən verilənlər bazasında əhəmiyyətli dərəcədə yaxşı performans əldə edib.
Model ilk dəfə 2022-ci ilin aprelində elan edildi və Google PaLM və bir sıra digər texnologiyalar üçün API təqdim edənə qədər 2023-cü ilin martına qədər gizli qaldı. API ictimaiyyətə təqdim edilməzdən əvvəl gözləmə siyahısına qoşulmuş məhdud sayda tərtibatçılar üçün əlçatan idi.
Google və DeepMind PaLM 540B-nin Med-PaLM adlı tibbi məlumatlar əsasında dəqiq tənzimlənmiş və tibbi sual-cavab meyarları üzrə əvvəlki modelləri üstələyən versiyasını hazırlayıblar. Med-PaLM ABŞ tibbi lisenziyalaşdırma sualları üzrə keçid balını keçən ilk şirkət olub və həm qapalı, həm də açıq suallara dəqiq cavab verməklə yanaşı, həm də əsaslandırma təqdim edir və cavablarını qiymətləndirə bilir.
Google həmçinin robot manipulyasiyası üçün istifadə edilə bilən ən müasir görmə dili modeli olan PaLM-E yaratmaq üçün görmə transformatorundan istifadə edərək PaLM-i genişləndirib. Model robototexnika sahəsindəki tapşırıqları təkrar təlimə və ya incə sazlamaya ehtiyac olmadan rəqabətli şəkildə yerinə yetirə bilər.
2023-cü ilin may ayında Google hər il keçirilən tədbirində PaLM 2-ni elan etdi. PaLM 2-nin 3,6 trilyon token üzərində öyrədilmiş 340 milyard parametr modeli olduğu bildirilir.
2023-cü ilin iyun ayında Google, PaLM-2 arxitekturası və işə salınmasından istifadə edən nitqdən nitqə tərcümə üçün yaradılan AudioPaLM-i elan etdi.
Öyrənmə
PaLM müxtəlif təbii dil tapşırıqlarını və istifadə hallarını özündə birləşdirən 780 milyard tokendən ibarət yüksək keyfiyyətli korpusda əvvəlcədən hazırlanmışdır. Bu verilənlər bazasına filtrdən keçmiş veb səhifələr, kitablar, Vikipediya məqalələri, xəbər məqalələri, GitHub-dakı açıq mənbəli repozitoriyalardan əldə edilmiş mənbə kodu və sosial media söhbətləri daxildir. O, Google-un modelini öyrətmək üçün istifadə olunan verilənlər bazasına əsaslanır. Məlumat dəstinin sosial media söhbət hissəsi korpusun 50%-ni təşkil edir ki, bu da modelin dialoq qabiliyyətinə kömək edir.
PaLM 540B, bu günə qədər təsvir edilən ən böyük konfiqurasiyası olan model və məlumat paralelliyi kombinasiyasından istifadə etməklə birləşdirilən 768 hosta qoşulmuş hər Podda 3,072 TPU v4 çipi olan iki TPU v4 Pod üzərində öyrədilmişdir. Bu, 6,144 çipdən istifadə edərək, miqyasda səmərəli öyrənməyə imkan verdi və bu miqyasda LLM-lər üçün əldə edilən ən yüksək öyrənmə səmərəliliyi rekordunu (cihazın FLOPS istifadəsi 57,8%) qırdı.
Həmçinin bax
İstinadlar
- ↑ Narang, Sharan; Chowdhery, Aakanksha. . ai.googleblog.com (ingilis). 4 April 2022 tarixində . İstifadə tarixi: 17 March 2023.
- ↑ Chowdhery, Aakanksha; Narang, Sharan; Devlin, Jacob; və b. "PaLM: Scaling Language Modeling with Pathways". 2022. arXiv: [].
- ↑ Anadiotis, George. . VentureBeat. 12 April 2022. 21 September 2022 tarixində . İstifadə tarixi: 17 March 2023.
- Bastian, Matthias. . THE DECODER. 5 April 2022. 19 October 2022 tarixində . İstifadə tarixi: 17 March 2023.
- . seekingalpha.com (ingilis). 12 December 2022. 12 December 2022 tarixində . İstifadə tarixi: 17 March 2023.
- Vincent, James. . The Verge. 14 March 2023. 14 March 2023 tarixində . İstifadə tarixi: 17 March 2023.
- Huffman, Scott; Woodward, Josh. (ingilis). 14 March 2023 tarixində . İstifadə tarixi: 17 March 2023.
- Singhal, Karan; Azizi, Shekoofeh; Tu, Tao; və b. "Large Language Models Encode Clinical Knowledge". 2022. arXiv: [].
- . The Medical Futurist. 17 January 2023. 17 January 2023 tarixində . İstifadə tarixi: 17 March 2023.
- Matias, Yossi; Corrado, Greg. . Google (ingilis). 14 March 2023. 14 March 2023 tarixində . İstifadə tarixi: 17 March 2023.
- Driess, Danny; Xia, Fei; Sajjadi, Mehdi S. M.; və b. "PaLM-E: An Embodied Multimodal Language Model". 2023. arXiv: [].
- Driess, Danny; Florence, Pete. . ai.googleblog.com (ingilis). 10 March 2023 tarixində . İstifadə tarixi: 17 March 2023.
- Edwards, Benj. . Ars Technica (ingilis). 7 March 2023. 7 March 2023 tarixində . İstifadə tarixi: 17 March 2023.
- Lardinois, Frederic. . . May 10, 2023. May 10, 2023 tarixində . İstifadə tarixi: May 10, 2023.
- Elias, Jennifer. . CNBC. 16 May 2023. 16 May 2023 tarixində . İstifadə tarixi: 18 May 2023.
- . google-research.github.io. 2023-06-29 tarixində . İstifadə tarixi: 2023-06-30.
- . www.deepmind.com (ingilis). 13 April 2022 tarixində . İstifadə tarixi: 17 March 2023.