ჩვენ ვაკანსიების სერვისი გავუშვით: გამოაქვეყნეთ ვაკანსიები და მიიღეთ უკუკავშირი!

გენერაციული AI-ის 4 ტიპი, რომელიც ჩვენს სამყაროს გარდაქმნის

ტერმინი «გენერაციული AI» ხელოვნური ინტელექტის შედარებით ახალ სფეროს ეხება, რომელსაც ადამიანის მსგავსი შინაარსის შექმნა შეუძლია  — სურათებიდან და ვიდეოებიდან დაწყებული, პოეზიითა და კომპიუტერული კოდებით დამთავრებული.

კომენტარის დატოვება
გენერაციული AI-ის 4 ტიპი, რომელიც ჩვენს სამყაროს გარდაქმნის

ტერმინი «გენერაციული AI» ხელოვნური ინტელექტის შედარებით ახალ სფეროს ეხება, რომელსაც ადამიანის მსგავსი შინაარსის შექმნა შეუძლია  — სურათებიდან და ვიდეოებიდან დაწყებული, პოეზიითა და კომპიუტერული კოდებით დამთავრებული.

ამ მიზნის მისაღწევად რამდენიმე განსხვავებული ტექნიკა გამოიყენება. ისინი ძირითადად ბოლო 10 წლის განმავლობაში განვითარდა —  ეყრდნობა ადრე ჩატარებულ სამუშაოებს ღრმა სწავლის, ტრანსფორმატორის მოდელებისა და ნერვული ქსელების სფეროებში.

ყველა მათგანი მონაცემებს ეყრდნობა, რათა შინაარსის გენერირება ეფექტურად «ისწავლონ», მაგრამ ამის გარდა, ისინი სრულიად განსხვავებული მეთოდოლოგიების ირგვლივ არიან აგებული. გთავაზობთ, გენერაციული AI-ის 4 ტიპს, რომელიც ჩვენს სამყაროს გარდაქმნის:

დიდი ენობრივი მოდელები (LLM)

დიდი ენობრივი მოდელები (LLM) ფუნდამენტური ტექნოლოგიაა, რომელიც ისეთი AI ინსტრუმენტების უკან იმალება, როგორიცაა ChatGPT, Claude და Google Gemini. ძირითადად, ეს ნერვული ქსელებია, რომლებიც ტექსტის უზარმაზარ რაოდენობაზე იწვრთნებიან, რაც მათ საშუალებას აძლევს, სიტყვებს შორის კავშირი შეისწავლონ და იწინასწარმეტყველონ შემდეგი სიტყვა, რომელიც სიტყვების კონკრეტულ თანმიმდევრობაში უნდა გამოჩნდეს. 

სიტყვები «ნაწილებად» იყოფა, რომლებიც შეიძლება მცირე, ცალკეული სიტყვები, გრძელი სიტყვების ნაწილები ან პრეფიქსების, სუფიქსებისა და სხვა ენობრივი ელემენტების კომბინაციები იყოს, რომლებიც ხშირად ტექსტში ჩნდება. შემდეგ მატრიცის ტრანსფორმაციის (matrix transformation) მათემატიკური პროცესი გამოიყენება მათი სტრუქტურირებულ ციფრულ მონაცემებად გადასაყვანად, რომლებიც შეიძლება კომპიუტერებით გაანალიზდეს.

ტექსტისა და კომპიუტერული კოდის შექმნის გარდა, LLM-ებმა შესაძლებელი გახადეს კომპიუტერებისთვის ბუნებრივი ენის გაგება მრავალი ამოცანისთვის, მათ შორის ენის თარგმნის, განწყობის ანალიზისა და გენერაციული ხელოვნური ინტელექტის სხვა ფორმებისთვის. თუმცა, მათმა გამოყენებამ ეთიკური შეშფოთება შექმნა მიკერძოებულობის, ხელოვნური ინტელექტის ჰალუცინაციის, დეზინფორმაციის, deep-fake-ებისა და ინტელექტუალური საკუთრების გამოყენების ალგორითმების მომზადების შესახებ.

დიფუზიური მოდელები

დიფუზიური მოდელები გამოსახულებისა და ვიდეოების გენერირებაში ფართოდ გამოიყენება და მუშაობს პროცესის მეშვეობით, რომელიც ცნობილია როგორც «iterative denoising». ტექსტური მოთხოვნით კომპიუტერი ხვდება, თუ რა გამოსახულება უნდა შექმნას. 

თანდათანობით, ნახაზები იხვეწება. საბოლოოდ, ეს სრულიად ახალი სურათის შექმნას იწვევს, რომელიც ტექსტის მოთხოვნას ემთხვევა.

ამ პროცესით, დღევანდელი დიფუზიის ყველაზე მოწინავე მოდელებს, როგორიცაა Stable Diffusion და Dall-E, შეუძლიათ ფოტო-რეალისტური სურათები შექმნან, ისევე როგორც სურათები, რომლებიც ნებისმიერი სტილის ფერწერასა და ნახატს გაიმეორებს. უფრო მეტიც, მათ ვიდეოების გენერირებაც მაღალ დონეზე შეუძლიათ, რაც ახლახან OpenAI-ის ინოვაციურმა მოდელმა, Sora-მ აჩვენა.

გენერაციული საპირისპირო ქსელები (Generative Adversarial Networks)

Generative Adversarial Networks (GANs) 2014 წელს გაჩნდა და ერთ-ერთი ყველაზე ეფექტური მოდელი, როგორც ტექსტის, ასევე სურათების გენერირებისთვის სწრაფად გახდა. ძირითადი პრინციპი ორი განსხვავებული ალგორითმის ერთმანეთთან დაპირისპირებას გულისხმობს. ერთი ცნობილია როგორც «გენერატორი», ხოლო მეორე — როგორც «დისკრიმინატორი». ორივეს ეძლევა დავალება, რომ ერთმანეთის წინააღმდეგ უკეთესები იყვნენ. გენერატორი ცდილობს რეალისტური შინაარსი შექმნას, ხოლო დისკრიმინატორი ადგენს, რეალურია თუ არა ის. ისინი ერთმანეთისგან სწავლობენ და თავის საქმეში უკეთესები ხდებიან იქამდე, სანამ გენერატორი არ ისწავლის, როგორ შექმნას კონტენტი, რომელიც რაც შეიძლება ახლოს იქნება რეალურთან.

მიუხედავად იმისა, რომ დიდი ენობრივი მოდელები და დიფუზიური მოდელები, რომლებიც ისეთ ინსტრუმენტებში გამოყენება, როგორიცაა ChatGPT და Dall-E, დიდი პოპულარობით სარგებლობსმ, GAN მაინც განიხილება მრავალმხრივ და ძლიერ იარაღად სურათების, ვიდეოს, ტექსტისა და ხმის გენერირებისთვის. ის კომპიუტერული ხედვისა და ბუნებრივი ენის დამუშავების ამოცანებისთვის ფართოდ გამოიყენება.

ნერვული გამოსხივების ველები (Neural Radiance Fields)

ნერვული გამოსხივების ველები (NeRFs) უახლესი ტექნოლოგიაა, რომელიც სცენაზე მხოლოდ 2020 წელს გამოჩნდა. სხვა გენერაციული ტექნოლოგიებისგან განსხვავებით, ისინი ღრმა სწავლის გამოყენებით სპეციალურად 3D ობიექტების წარმოდგენების შესაქმნელად გამოიყენება. ეს სურათის ისეთი ასპექტის შექმნას გულისხმობს, რომელიც  «კამერით» არ ჩანს.

ეს ისეთი ელემენტების პროგნოზირებით კეთდება, როგორიცაა ობიექტების მოცულობითი თვისებები და მათი 3D სივრცის კოორდინატებზე დახატვა, ნეირონული ქსელების გამოყენებით გეომეტრიისა და ისეთი თვისებების მოდელირებისთვის, როგორიცაა სინათლის არეკვლა ობიექტის გარშემო.

ეს საშუალებას იძლევა, მაგალითად, ობიექტის ორგანზომილებიანი გამოსახულება — ვთქვათ, შენობა ან ხე — ხელახლა შეიქმნას, როგორც სამგანზომილებიანი წარმოდგენა, რომლის დანახვაც ნებისმიერი კუთხიდან შესაძლებელია. Nvidia-ს მიერ დანერგილი ეს ტექნიკა 3D სამყაროების შესაქმნელად გამოიყენება, რომლებიც შეიძლება სიმულაციებში და ვიდეო თამაშებში, ასევე რობოტიკის, არქიტექტურისა და ურბანული დაგეგმარების ვიზუალიზაციისთვის გამოგვადგეს.

რამდენის გამომუშავება შეუძლიათ ხელოვანებს გენერაციული ხელოვნური ინტელექტით
რამდენის გამომუშავება შეუძლიათ ხელოვანებს გენერაციული ხელოვნური ინტელექტით
თემის მიხედვით
რამდენის გამომუშავება შეუძლიათ ხელოვანებს გენერაციული ხელოვნური ინტელექტით
კვლევა — გენერაციული AI გავლენას 300 მილიონ სამუშაო ადგილზე მოახდენს
კვლევა — გენერაციული AI გავლენას 300 მილიონ სამუშაო ადგილზე მოახდენს
თემის მიხედვით
კვლევა — გენერაციული AI გავლენას 300 მილიონ სამუშაო ადგილზე მოახდენს


ასევე წაიკითხეთ
როგორ შეიძლება, ხელოვნურმა ინტელექტმა შეცვალოს LGBTQIA+ ადვოკატირება
როგორ შეიძლება, ხელოვნურმა ინტელექტმა შეცვალოს LGBTQIA+ ადვოკატირება
როგორ შეიძლება, ხელოვნურმა ინტელექტმა შეცვალოს LGBTQIA+ ადვოკატირება
ახალი AI Comes Out of the Closet — «AI კარადიდან გამოდის» სისტემა მიზნად ისახავს ხელოვნური ინტელექტისა და LGBTQIA+ მხარდაჭერის შერწყმას.  ავტორი: დევიდ სვინი, MIT
AI-ის დამსახურებით, Nvidia-ს მოგება 600%-ით გაიზარდა
AI-ის დამსახურებით, Nvidia-ს მოგება 600%-ით გაიზარდა
AI-ის დამსახურებით, Nvidia-ს მოგება 600%-ით გაიზარდა
Truecaller და Microsoft მომხმარებლებს ზარებზე პასუხის გასაცემად AI ხმის შექმნის ნებას მისცემს
Truecaller და Microsoft მომხმარებლებს ზარებზე პასუხის გასაცემად AI ხმის შექმნის ნებას მისცემს
Truecaller და Microsoft მომხმარებლებს ზარებზე პასუხის გასაცემად AI ხმის შექმნის ნებას მისცემს
რა წერია ევროპული საბჭოს მიერ მიღებულ AI აქტში
რა წერია ევროპული საბჭოს მიერ მიღებულ AI აქტში
რა წერია ევროპული საბჭოს მიერ მიღებულ AI აქტში
დღეს, 21 მაისს ევროპულმა საბჭომ მიიღო ხელოვნური ინტელექტის აქტი — კანონი, რომელიც «მიზნად ისახავს ხელოვნური ინტელექტის წესების ჰარმონიზაციას». ევროპული საბჭო აცხადებს, რომ აქტი მიჰყვება რისკებზე დაფუძნებულ მიდგომას — რაც უფრო მაღალია საზოგადოებისთვის ზიანის მიყენების რისკი, მით უფრო მკაცრია წესები. ეს არის პირველი კანონმდებლობა მსოფლიოში, რომელსაც შეუძლია, დააწესოს ხელოვნური ინტელექტის რეგულირების გლობალური სტანდარტი.
განხილვა
კომენტარები ჯერ არაა.