
OpenAI 2022 оны сүүлээр ChatGPT-г эхлүүлэхэд баяр баясгалан, түгшүүр төрүүлэв. Генератив хиймэл оюун ухаан нь эссэ бичих, кодлох асуудлыг шийдвэрлэх, тэр ч байтугай урлагийг бүтээх гайхалтай боломжийг харуулсан. Гэхдээ энэ нь байгаль орчны мэргэжилтнүүд, судлаачид, технологичдын дунд түгшүүр төрүүлэв. Хамгийн их санаа зовоосон зүйл? Том хэлний загваруудыг (LLMs) сургаж, ажиллуулахад шаардагдах асар их эрчим хүчний хэрэглээ нь тэдний урт хугацааны тогтвортой байдлын талаар асуултуудыг төрүүлдэг.
LLM-ууд боловсрол, эрүүл мэнд зэрэг салбаруудыг өөрчлөн шинэчилсээр байгаа тул тэдний нөлөөг үл тоомсорлож болохгүй. Энэхүү баримт бичиг нь нэг чухал асуултыг дэвшүүлж байна: Эдгээр ухаалаг системүүд эрчим хүчний хэрэглээг багасгаж, хүрээлэн буй орчны ул мөрийг багасгахын тулд өөрсдийгөө оновчтой болгож чадах уу? Хэрэв тийм бол энэ нь хиймэл оюун ухааны ландшафтыг хэрхэн өөрчлөх вэ?
Бид сургалтаас авахуулаад дүгнэлт гаргах хүртэлх LLM-ийн эрчим хүчний сорилтуудыг задалж, хиймэл оюун ухааныг илүү тогтвортой болгох шинэлэг өөрийгөө тохируулах стратегиудыг судлах болно.
Google-ийн GPT-4 эсвэл PaLM зэрэг том хэлний загваруудыг сургах нь асар их хэмжээний тооцооллын нөөц шаарддаг. Жишээлбэл, GPT-3-ыг сургахад хэдэн мянган GPU-г долоо хоног ажиллуулж, АНУ-ын хэдэн зуун айлын нэг жилийн эрчим хүчийг зарцуулсан. Нүүрстөрөгчийн ул мөр нь мэдээллийн төвүүдийг тэжээж буй эрчим хүчний хольцоос хамаарна. Сургалтын дараа ч гэсэн дүгнэлтийн үе шат буюу загвар нь бодит ажил үүргийг гүйцэтгэдэг бөгөөд эрчим хүчний хэрэглээг нэмэгдүүлдэг. Хэдийгээр нэг асуулгад шаардагдах эрчим хүч бага боловч бид өдөр бүр янз бүрийн платформ дээр олон тэрбум ийм харилцан үйлчлэл явагддаг гэж үзвэл энэ нь чухал асуудал болж хувирдаг.
Загварын хэмжээ: Өнөөдрийн LLM нь параметрийн мэдрэмжтэй байдаг; тэдгээр нь боловсруулах, шинэчлэх, хадгалахад асар их нөөц шаарддаг хэдэн тэрбум, бүр их наяд параметртэй.
Техник хангамжийн хязгаарлалт: Цахиурт суурилсан чипүүдийн хэрэглээ нь тэдгээрийн боловсруулах хүчин чадлаар хязгаарлагддаг бөгөөд ингэснээр эрчим хүчний хэрэглээг экспоненциалтайгаар нэмэгдүүлэхийн тулд GPU эсвэл TPU-ийн кластер шаардлагатай байдаг.
Байгаль орчны зардалд нүүрстөрөгчийн ялгаралт, хөргөлтийн усны хэрэглээ багтдаг бол үйл ажиллагааны зардал нь хиймэл оюун ухааны жижиг компаниудын хувьд асуудал болдог. Жилийн зардал хэдэн тэрбумд хүрч магадгүй бөгөөд энэ нь тогтвортой байдлыг зөвхөн байгаль орчны төдийгүй эдийн засгийн чухал асуудал болгодог.
LLM-үүд хэрхэн эрчим хүч зарцуулдгийг ойлгохын тулд үүнийг задалж үзье:
AI үйл ажиллагаа | Эрчим хүчний хэрэглээ (%) |
---|---|
Сургалтын үе шат | 60% |
Дүгнэлт (Ажиллаж буй асуулга) | 25% |
Дата төвийн хөргөлт | 10% |
Техник хангамжийн үйл ажиллагаа | 5% |
Гол арга хэмжээ: Сургалтын үе шат нь эрчим хүчний хэрэглээнд хамгийн их хувь нэмэр оруулсан хэвээр байна.
Судлаачид LLM нь програм хангамжийн ажлыг техник хангамжийн өөрчлөлттэй хослуулан эрчим хүчний хэрэглээгээ хэрхэн оновчтой болгох талаар судалж байна.
Хэмжээ тогтоох, тайрах нь ашигтай боловч загвар нь аль хэсэг нь чухал болохыг, аль хэсгийг тоолж болохыг тодорхойлох боломжтой бол санал хүсэлтийн гогцоотой ашиглах үед энэ нь нэлээд үр дүнтэй болно. Энэ бол шинэ газар боловч өөрийгөө оновчтой болгох сүлжээнүүдэд боломж бий.
Нөхцөлт тооцооллын санаа нь загваруудад зөвхөн өгөгдсөн даалгаварт хамаарах нейрон эсвэл давхаргыг ашиглах боломжийг олгодог. Жишээлбэл, Google-ийн мэргэжилтнүүдийн холимог (МЭ) арга нь сүлжээг идэвхтэй параметрүүдийн тоог хязгаарлах замаар сургалтыг сайжруулж, эрчим хүчний хэрэглээг бууруулдаг тусгай дэд сүлжээнд хуваадаг.
Загваруудыг үр ашигтай ажиллуулахын тулд сургалтын хурд, багцын хэмжээ, нарийвчлал, эрчим хүчний зарцуулалтыг тэнцвэржүүлэх зэрэг гиперпараметрүүдийг оновчтой болгох боломжтой.
LLM нь нарийвчлалыг оновчтой болгохоос гадна Google Vizier эсвэл Ray Tune зэрэг хэрэгслийг ашиглан нарийвчлал, хоцролт, эрчим хүчний зарцуулалт зэрэг бусад зорилтуудыг оновчтой болгож чадна. Сүүлийн үед эрчим хүчний хэмнэлт нь эдгээр хүрээнд шийдвэрлэх зорилт болоод байна.
Техник хангамжийг програм хангамжтай хослуулан бүтээсэн хиймэл оюун ухааны системүүд нь програм хангамжийн алгоритм болон техник хангамжийн нөөцийг нэгэн зэрэг тохируулах боломжийг олгодог.
Техник | Эрчим хүчний бууралт (%) | Үндсэн ашиг тус |
---|---|---|
Загвар тайрах | 30% | Шаардлагагүй загварын параметрүүдийг багасгадаг |
Квантжуулалт | 40% | Тооцооллын нарийвчлалыг бууруулдаг |
Нөхцөлт тооцоолол (МЭ) | 25% | Зөвхөн шаардлагатай загварыг идэвхжүүлнэ |
Бататгах сургалт | 15% | Эрчим хүчний хэрэглээг динамикаар тохируулна |
Нейроморфик тооцоолол | 50% | Тархины үр ашгийг дуурайдаг |
Техник хангамжийн хамтын дизайн (ASIC, оптик чип) | 35% | Хамгийн их үр ашигтай байхын тулд хиймэл оюун ухаанд зориулсан техник хангамжийг хөгжүүлдэг |
Ирээдүйн AI загварууд нь нийт эрчим хүчийг 60-70% бууруулахын тулд олон арга техникийг хослуулах магадлалтай.
Өөрийгөө оновчтой болгох LLM нь олон тэрбум асуулгад зориулж эрчим хүчний хэрэглээг 20 ба түүнээс дээш хувиар бууруулж, асар их зардал, ялгаруулалтыг хэмнэх болно. Энэ нь дэлхийн цэвэр тэг зорилттой нийцэж байгаа бөгөөд хэд хэдэн салбарт нөлөөлж байна:
LLM нь хэлний боловсруулалтын шинэ түвшний боловсронгуй байдлыг авчирсан боловч тэдний эрчим хүчний хэрэглээний асуудал хамгийн их анхаарал татаж байна. Гэсэн хэдий ч эдгээр загварыг бий болгосон оюун ухаан нь шийдлийг өгдөг. Тайрах, хэмжигдэхүүн, нөхцөлт тооцоолол, техник хангамжийн хамтарсан дизайн зэрэг техникүүд нь өөрсдийн эрчим хүчний хэрэглээг удирддаг LLM-ийг зохион бүтээх боломжтойг харуулж байна. Судалгааны ажил ахих тусам тогтвортой хиймэл оюун ухаан боломжтой эсэх, технологийн салбар хүрээлэн буй орчны төлөө инновацийг золиослохгүйгээр хэр хурдан нэгдэж чадах вэ гэдэг асуудал багасч байна.
Лавлагаа