დიდი ხუთეული და ხელოვნური ინტელექტის რევოლუცია

2022 წლის ისტორია შეიძლება ხელოვნური ინტელექტის განვითარებას მიეძღვნას. გამოჩნდა გამოსახულების გენერირების მოდელები, მათ შორის DALL-E, MidJourney, ღია კოდის Stable Diffusion, შემდეგ კი ChatGPT — ტექსტური თაობის პირველი მოდელი, რომელიც ფართოდ გავრცელდა. დაიწყო ტექნოლოგიის ახალი ეპოქა.

კომენტარის დატოვება
დიდი ხუთეული და ხელოვნური ინტელექტის რევოლუცია

2022 წლის ისტორია შეიძლება ხელოვნური ინტელექტის განვითარებას მიეძღვნას. გამოჩნდა გამოსახულების გენერირების მოდელები, მათ შორის DALL-E, MidJourney, ღია კოდის Stable Diffusion, შემდეგ კი ChatGPT — ტექსტური თაობის პირველი მოდელი, რომელიც ფართოდ გავრცელდა. დაიწყო ტექნოლოგიის ახალი ეპოქა.

იმის დასადგენად, თუ როგორ შეიძლება განვითარდეს ეს ეპოქა, კარგი იქნება, გავიხსენოთ 26 წლის წინ გამოცემული ყველა დროის ერთ-ერთ ყველაზე ცნობილ სტრატეგიული წიგნი: კლეიტონ კრისტენის The Innovator’s Dilemma, განსაკუთრებით — მონაკვეთი სხვადასხვა სახის ინოვაციის შესახებ:

«ახალი ტექნოლოგიების უმეტესობა ხელს უწყობს პროდუქტის გაუმჯობესებულ შესრულებას. მე მათ მდგრად ტექნოლოგიებს ვუწოდებ. ზოგიერთი მდგრადი ტექნოლოგია შესაძლოა წყვეტილი ან რადიკალური ხასიათის იყოს, ზოგი კი — ზრდადი.

ყველა მდგრად ტექნოლოგიას აერთიანებს ის, რომ ისინი აუმჯობესებენ დამკვიდრებული პროდუქციის ეფექტურობას იმ განზომილებების მიხედვით, რომლებსაც ძირითადი ბაზრების ძირითადი მომხმარებლები ისტორიულად აფასებდნენ. მოცემულ ინდუსტრიაში ტექნოლოგიური მიღწევების უმეტესობა მდგრადია. 

გამრღვევ (disruptive) ტექნოლოგიებს ბაზარზე ადგინდელისგანც განსხვავებული „ღირებული წინადადებები“ მოაქვთ. გამრღვევი ტექნოლოგიები უფრო ცუდად მუშაობენ, ვიდრე ბაზრის მეინსტრიმ პროდუქტები. თუმცა, მათ აქვთ სხვა ფუნქციები, რომლებსაც არამუდმივი (და ზოგადად, ახალი) მომხმარებელი აფასებს. გამრღვევ ტექნოლოგიებზე დაფუძნებული პროდუქტები, როგორც წესი, უფრო იაფი, მარტივი და პატარაა და ხშირად, უფრო მოსახერხებელია გამოსაყენებლად». 

როგორც ჩანს, ადვილია უკან გახედვა და იმის დადგენა, იყო თუ არა ინოვაცია მდგრადი ან გამრღვევი. ამას პროდუქტის ბაზარზე გამოჩენის შემდეგ არსებული კომპანიების ქმედებები გვაჩვენებს. თუ ინოვაცია მდგრადი აღმოჩნდა, კომპანიები გაძლიერდნენ. თუ გამრღვევი აღმოჩნდა, მაშინ, სავარაუდოა, რომ ღირებულების უმეტესი ნაწილი სტარტაპებმა დაიპყრეს.

გავითვალისწინოთ გასული ტექნოლოგიური ეპოქები:

  • კომპიუტერი გამრღვევი იყო თითქმის ყველა მოქმედი მენეჯერისთვის. ამ შედარებით იაფ და დაბალი სიმძლავრის მოწყობილობებს არ ჰქონდათ ის შესაძლებლობები და სარგებელი, რომლებიც მინი კომპიუტერებს აქვთ. სწორედ ამიტომ IBM-მა intel-სა და Microsoft-ს სიამოვნებით გადასცა როგორც ორიგინალი კომპიუტერის ჩიპი, ასევე ოპერაციული სისტემა, რათა მათ შეძლებოდათ პროდუქტის გატანა და თავიანთი კორპორაციული მომხმარებლების დაკმაყოფილება. თუმცა, კომპიუტერები უფრო სწრაფი გახდა და სწორედ Intel-მა და Microsof-მა მოიპოვეს დომინირება, რადგან ბაზარმა დააპატარავა ყველაფერი, რაც ადრე არსებობდა.

  • ინტერნეტი ბაზრის თითქმის სრულიად ახალი ინოვაცია აღმოჩნდა და შესაბამისად, განისაზღვრა სრულიად ახალი კომპანიების მიერ, რომლებიც მას ტექნოლოგიებისგან დაშორებულ ინდუსტრიებში იყენებდნენ, მათ შორის, მედიაში. ეს იყო Google-ის, Facebook-ის, ონლაინ ბაზრების და ელექტრონული კომერციის ეპოქა. ყველა აპლიკაცია მუშაობდა Windows-სა და Intel-ის კომპიუტერებზე.

  • Cloud Computing, სავარაუდოდ, ინტერნეტის ნაწილია, თუმცა ცალკე კატეგორიას იმსახურებს. ის ასევე უკიდურესად გამრღვევი იყო. აღსანიშნავია, რომ Cloud Computing-ის ძირითადი ინფრასტრუქტურა, პირველ რიგში, შეიქმნა წინა ეპოქის გამარჯვებულების მიერ: Amazon, Microsoft და Google.

  • მობილურის ბედი ორი კომპანიის დომინაცია აღმოჩნდა: Apple და Google. თუმცა ეს არ ნიშნავს, რომ ის არ იყო გამრღვევი. Apple-ის ახალი ინტერფეისის პარადიგმა არ განიხილავს ტელეფონს, როგორც პატარა კომპიუტერს, ისევე, როგორც მაიკროსოფტი. Google-ის ახალი ბიზნეს მოდელის პარადიგმა მოიცავდა არა ტელეფონებს, როგორც პირდაპირი მოგების ცენტრს ოპერატიული სისტემების გაყიდვისთვის, არამედ როგორც სარეკლამო ბიზნესს.

გამრღვევი ინოვაციები მუდმივად მოდის ახალ ბაზარზე დამწყებებისგან, მაგრამ, ეს დამწყებები სულაც არ არიან სტარტაპები. წინა ტექნიკურ ეპოქებში ზოგიერთი დიდი გამარჯვებული არსებული კომპანია იყო, რომლებიც იყენებდნენ თავიანთ ამჟამინდელ ბიზნესის სახელებს ახალ სივრცეში გადასასვლელად.

ახალი ეპოქების არსებული კომპანიების წარმატების გათვალისწინებით, ხელოვნური ინტელექტის გავლენის შესახებ ფიქრისას ყველაზე აშკარა სამიზნეებს დიდი ხუთეული: Apple, Amazon, Facebook (Meta), Google და Microsoft წარმოადგენს.

Apple

ერთ-ერთი ყველაზე ცნობილი ესე ტექნოლოგიური სტრატეგიების შესახებ — Strategy Letter V — ჯოელ სპოლსკის ეკუთვნის. განსაკუთრებით ცნობილი ფრაზაა:

«ჭკვიანი კომპანიები საქონლის ბირჟაზე თავიანთი პროდუქტის დამატებას ცდილობენ». 

სპოლსკიმ ეს ციტატა მიუძღვნა დიდი კომპანიების მიერ ღია წყაროს პროგრამული უზრუნველყოფაში ინვესტიციების ჩადების მიზეზების ახსნას.

«გამართული კოდი არ არის უფასო, იქნება ეს დახურული თუ ღია კოდი. მაშინაც კი, თუ ამაში ფულს არ იხდით, მას აქვს შესაძლებლობის ფასი და დროის ფასი.

არსებობს პროგრამირების მცოდნე მოხალისეების განსაზღვრული რაოდენობა ღია წყაროზე სამუშაოდ, თითოეული ღია წყაროზე დაფუძნებული პროექტი უპირისპირდება ერთმანეთს ერთი და იმავე — შეზღუდული პროგრამირების რესურსისთვის. მხოლოდ საუკეთესო პროექტებს ჰყავთ იმაზე მეტი მოხალისე დეველოპერი, ვიდრე გამოყენება შეუძლიათ.

მოკლედ რომ შევაჯამოთ, არ ვარ დიდად მოხიბლული იმ ადამიანებით, რომლებიც ცდილობენ, დაამტკიცოს ველური ეკონომიკის საკითხები free-as-in-beer პროგრამულ უზრუნველყოფაზე, რადგან, რამდენადაც ჩემთვის ცნობილია, ისინი უბრალოდ იღებენ ნულზე გაყოფილ შეცდომებს.

ღია წყარო არ თავისუფლდება ეკონომიკის ან გრავიტაციის კანონებისგან. ჩვენ ვნახეთ ეს Ezel-თან, ArsDigita-სთან, კომპანიასთან, რომელიც ადრე Va Linux-ის სახელით იყო ცნობილი და მრავალ სხვა შემთხვევაში.

მაგრამ, კიდევ ხდება რაღაც, რაც ღია წყაროების სამყაროში ძალიან ცოტა ადამიანს ესმის: ბევრი ძალიან მსხვილი კომპანია, რომელსაც აქვთ აქციონერთა ღირებულების მაქსიმალიზაციის პასუხისმგებლობა, დიდ ფულს დებენ ღია კოდის პროგრამული უზრუნველყოფის მხარდაჭერაში, როგორც წესი, პროგრამისტების დიდი ჯგუფების მუშაობით.

სწორედ ამას ხსნის დამატებითი პროდუქტის პრინციპი (principle of complements).

ერთხელაც რომ განვიხილოთ: პროდუქტზე მოთხოვნა იზრდება, როდესაც დამატებითი პროდუქტის ფასი მცირდება. ზოგადად, კომპანიის სტრატეგიული ინტერესი იქნება მათი დამატებითი პროდუქციის ფასის მაქსიმალურად შემცირება. ყველაზე დაბალი მდგრადი ფასი, თეორიულად, იქნება «საქონლის ფასი» — ფასი, რომელიც წარმოიქმნება მაშინ, როდესაც გყავთ ძალიან ბევრი კონკურენტი, რომლებიც გვთავაზობენ განსხვავებულ საქონელს. ამიტომ, ჭკვიანი კომპანიები ცდილობენ, საქონლის ბაზარზე შექმნან დამატებითი პროდუქტი. თუ თქვენ შეძლებთ ამის გაკეთებას, თქვენს პროდუქტზე მოთხოვნა გაიზრდება, თქვენ შეძლებთ, გაზარდოთ ფასი და გამოიმუშაოთ მეტი». 

Apple ინვესტიციებს დებს ღია წყაროს ტექნოლოგიებში, განსაკუთრებით დარვინის ბირთვში მისი ოპერაციული სისტემებისთვის და Webkit ბრაუზერის ძრავისთვის. ეს უკანასკნელი ერგება სპოლსკის რეცეპტს, რადგან იმის უზრუნველყოფა, რომ ვები კარგად მუშაობს Apple-ის მოწყობილობებთან, მას მათ უფრო ღირებულს ხდის.

ამავდროულად, Apple-ის ძალისხმევა ხელოვნური ინტელექტის სფეროში, ძირითადად, საკუთრებითი იყო: ტრადიციული მანქანური სწავლების მოდელები გამოიყენება ისეთ საკითხებისთვის, როგორებიცაა რეკომენდაციები, ფოტო იდენტიფიკაცია და ხმის ამოცნობა, მაგრამ არაფერი ისეთი, რაც Apple-ის ბიზნესის მდგომარეობას რადიკალურად ცვლის. თუმცა, Apple-მა მიიღო საჩუქარი ღია წყაროს სამყაროსგან: სტაბილური დიფუზია.

ხელოვნური ინტელექტი, სტაბილური დიფუზია არის ლატენტური დიფუზიის მოდელი, რომელსაც შეუძლია ტექსტური აღწერილობიდან დეტალური სურათების გენერირება. ის ასევე შეიძლება გამოიყენონ ისეთ ამოცანებისთვის, როგორიცაა ფერწერა, ტექსტი სურათად და სურათის სხვა სურათად ქცევა.

სტაბილური დიფუზია გასაოცარია არა მხოლოდ იმიტომ, რომ ის ღია წყაროა, არამედ იმიტომაც, რომ მოდელი საოცრად პატარაა: როდესაც ის გამოვიდა, მას უკვე შეეძლო გაშვება ზოგიერთ სამომხმარებლო გრაფიკულ ბარათზე. რამდენიმე კვირაში ის ოპტიმიზირებული იყო ისე, რომ შეძლებოდა Iphone-ზე მუშაობა.

Apple-მა გამოიყენა ეს შესაძლებლობა და გამოაქვეყნა განცხადება:

«დღეს ჩვენ მოხარულნი ვართ, გამოვაქვეყნოთ ოპტიმიზაცია Core ML-ზე სტაბილური დიფუზიისთვის macOS 13.1-სა და iOS 16.2-ში, ასევე კოდი Apple Silicon მოწყობილობებზე განლაგების დასაწყებად.

სტაბილური დიფუზიის ერთ-ერთ მთავარი კითხვა ნებისმიერ აპლიკაციაში არის ის, თუ სად მუშაობს მოდელი.

არსებობს მრავალი მიზეზი, თუ რატომ არის მოწყობილობაზე განლაგების სტაბილური დიფუზია სერვერულ მიდგომაზე უფრო სასურველი.

უპირველეს ყოვლისა, მომხმარებლის კონფიდენციალურობა დაცულია, რადგან მომხმარებლის მიერ მიწოდებული ნებისმიერი მონაცემი, როგორც შეყვანილი მოდელი, რჩება მომხმარებლის მოწყობილობაზე.

ასევე, საწყისი ჩამოტვირთვის შემდეგ, მომხმარებელს არ სჭირდება ინტერნეტ კავშირი მოდელის გამოსაყენებლად.

საბოლოოდ, ამ მოდელის ადგილობრივი დანერგვა საშუალებას აძლევს დეველოპერებს, შეამცირონ ან აღმოფხვრან სერვერთან დაკავშირებული ხარჯები. 

სტაბილური დიფუზიისთვის Core ML-ის ოპტიმიზაცია და მოდელის კონვერტაციის გამარტივება უადვილებს დეველოპერებს ამ ტექნოლოგიის ჩართვას თავიანთ აპლიკაციებში კონფიდენციალურობის შენარჩუნების და ეკონომიკურად მიზანშეწონილი გიზით, ამავდროულად Apple Silicon-ზე საუკეთესო შესრულების მიღებით.

ეს გამოცემა მოიცავს Python-ის პაკეტს სტაბილური დიფუზიის მოდელების გადასაყვანად PyTorch-დან Core ML-ზე დიფუზორებისა და coremltools-ის გამოყენებით, ასევე Swift-ის პაკეტს მოდელების დასაყენებლად». 

მნიშვნელოვანია აღინიშნოს, რომ ეს განცხადება ორ ნაწილად გამოვიდა: პირველი — Apple-მ თავად განახორციელა სტაბილური დიფუზიის მოდელის ოპტიმიზაცია (რისი გაკეთებაც მას შეეძლო, რადგან ის ღია წყარო იყო); მეორე —  Apple-მ განაახლა თავისი ოპერაციული სისტემა, რომელიც Apple-ის ინტეგრირებული მოდელის წყალობით უკვე მორგებულია Apple-ის ჩიპებზე.

უფრო მეტიც, შეიძლება ვივარაუდოთ, რომ ეს მხოლოდ დასაწყისია: Apple უკვე წლებია აგზავნის თავის ეგრეთ წოდებულ «ნერვულ ძრავას» საკუთარ ჩიპებზე, AI-ს სპეციფიკური აპარატურა  მორგებულია Apple-ის საჭიროებებზე. როგორც ჩანს, სავარაუდოა, რომ Apple-ის მომავალი ჩიპები უახლოეს მომავალში მორგებული იქნება სტაბილურ დიფუზიაზე. ამავდროულად, თავად სტაბილური დიფუზია შეიძლება ჩაშენდეს Apple-ს ოპერაციულ სისტემებში, ადვილად ხელმისაწვდომი API-ებით ნებისმიერი აპლიკაციის დეველოპერისთვის.

ეს აჩენს პერსპექტივას, რომ «საკმარისად კარგი» გამოსახულების გენერირების  შესაძლებლობები ეფექტურად ჩაშენდეს Apple-ის მოწყობილობებზე და, ამრიგად, ხელმისაწვდომი იყოს ნებისმიერი დეველოპერისთვის, უკვე ყველასთვის კარგად ნაცნობი Lensa-სთვის საჭირო უკანა ინფრასტრუქტურის გაფართოების საჭიროების გარეშე. ამ სამყაროში გამარჯვებულები ძალიან ჰგვანან App Store-ის ეპოქაში გამარჯვებულებს: Apple იმარჯვებს, რადგან მისი ინტეგრაცია და ჩიპური უპირატესობა გამოიყენება დიფერენცირებული აპლიკაციების მიწოდებისთვის, ხოლო მცირე, დამოუკიდებელი აპლიკაციების შემქმნელებს აქვთ API და სადისტრიბუციო არხი ახალი ბიზნესის ასაშენებლად.

მეორეს მხრივ, დამარცხებულები იქნებიან სურათების გენერირების ცენტრალიზებული სერვისები, როგორიცაა Dall-E ან MidJourney და ღრუბლოვანი პროვაიდერები, რომლებიც იცავენ მათ.  

DALL·E 2 - ხელოვნური ინტელექტის მხატვრობა სიტყვებით
DALL·E 2 — ხელოვნური ინტელექტის მხატვრობა სიტყვებით
თემის მიხედვით
DALL·E 2 — ხელოვნური ინტელექტის მხატვრობა სიტყვებით

სტაბილური დიფუზია Apple-ის მოწყობილობებზე ვერ დაიკავებს მთელ ბაზარს. Dall-E და MidJourney შედარებით უკეთესია ვიდრე სტაბილური დიფუზია  და რა თქმა უნდა, არსებობს მთელი სამყარო Apple-ის მოწყობილობების გარეთ. მაგრამ ჩაშენებული მოწყობილობები გავლენას იქონიებს საბოლოო ბაზარზე როგორც ცენტრალიზებული სერვისებისთვის, ასევე ცენტრალიზებული გამოთვლისთვის.

Amazon

Amazon, Apple-ის მსგავსად იყენებს მანქანურ სწავლებას თავის აპლიკაციებში. თუმცა, მომხმარებელთა მიერ პირდაპირი გამოყენების შემთხვევები ისეთი საგნებისთვის, როგორიცაა გამოსახულების და ტექსტის გენერაცია, ნაკლებად ჩანს. მნიშვნელოვანია AWS, რომელიც ყიდის გრაფიკული დამუშავების განყოფილებაზე (GPU) წვდომას ღრუბელში.

ზოგიერთი მათგანის გამოიყენება ვარჯიშისთვის, მათ შორის სტაბილური დიფუზია, რომელიც Stability AI-ს დამფუძნებლისა და აღმასრულებელი დირექტორის ემანდ მოსტაქუს თქმით, გამოყენებულ იქნა 256 NvidiaF A100-ებით 150 000 საათის განმავლობაში, საბაზრო ფასით —  აშშ დოლარით. თუმცა, უფრო დიდი გამოყენების შემთხვევაა დასკვნა (inference), ანუ მოდელის რეალური გამოყენება სურათების, ან ChatGPT-ის შემთხვევაში, ტექსტის წარმოებისთვის. ყოველ ჯერზე, როცა ქმნით სურათს MidJounrey-ში, ან ავატარს Lensa-ში, დასკვნა იწერება GPU-ს ღრუბელში.

Amazon-ის პერსპექტივები ამ სივრცეში მთელ რიგ ფაქტორებზე იქნება დამოკიდებული. პირველი და ყველაზე რეალური შეკითხვაა, რამდენად სასარგებლოა ეს პროდუქტები რეალურ სამყაროში. ამის გარდა, Apple-ის პროგრესს ჩაშენებული გენერირების ტექნიკის მშენებლობაში შეიძლება მნიშვნელოვანი გავლენა ჰქონდეს. თუმცა,  Amazon ჩიპების მწარმოებელია.

მიუხედავად იმისა, რომ დღემდე მისი ძალისხმევის უდიდესი ნაწილი ფოკუსირებულია Gravition CPU-ებზე, კომპანიას შეუძლია შექმნას საკუთარი სპეციალური აპარატურა ისეთი მოდელებისთვის, როგორიცაა სტაბილური დიფუზია და გახდეს კონკურენტული. 

დიდი, თუმცა, მოკლევადიანი კითხვა Amazon-ისთვის იქნება მოთხოვნილების გაზომვა: საკმარისი GPU-ის არქონის შემთხვევაში, ფული შენარჩუნდება. თუმცა, ძალიან ბევრის ყიდვა, რომელსაც კომპანია არაფერში გამოიყენებს, მნიშვნელოვან ხარჯებთან იქნება დაკავშირებული. ამასთან, შესაძლოა, ეს არ იყოს ყველაზე უარესი შეცდომა. ხელოვნური ინტელექტის ერთ-ერთი გამოწვევა არის ის, რომ დასკვნამდე მისვლა ფული ღირს. სხვა სიტყვებით რომ ვთქვათ, ხელოვნური ინტელექტის გამოყენებით რამის გაკეთებას ზღვრული ხარჯები აქვს.

ზღვრული დანახარჯების საკითხი არასაკმარისად განხილული თემაა AI პროდუქტების შემუშავების თვალსაზრისით. მიუხედავად იმისა, რომ ღრუბლოვან სერვისებს ყოველთვის ჰქონდათ ხარჯები, ხელოვნური ინტელექტის წარმოქმნის დისკრეტულმა ბუნებამ შესაძლოა რთული გახადოს ისეთი სახის გამეორებითი სამუშაოს დაფინანსება, რომელიც აუცილებელია პროდუქტის ბაზრისთვის შესაბამისობის მისაღწევად.

ChatGPT-ის გამორჩეულობა და სიდიდე შემთხვევითობა არ არის. ის უფასოა მომხმარებლებისთვის და შემუშავებულია OpenAI კომპანიის მიერ, რომელმაც შექმნა საკუთარი მოდელი და დადო შეთანხმება Microsoft-თან. თუ AWS-ს (Aamazon Web Services) მოუწევს GPU-ების იაფად გაყიდვა, გრძელვადიან პერსპექტივაში, ეს პროდუქტის უფრო მეტად გამოყენებას შეუწყობს ხელს.

აღინიშნა, რომ ეს ხარჯები დროთა განმავლობაში უნდა შემცირდეს: მოდელები გახდებიან უფრო ეფექტურიანები მაშინ, როცა ჩიპები გახდებიან უფრო სწრაფები და ეფექტურები. როდესაც ბაზარზე საკმარისი პროდუქტი იქნება, ღრუბლოვანი სერვისებისთვის ანაზღაურების მასშტაბი გაიზრდება. ეს გაზრდის პროდუქტის გამოყენებას.

Meta

Meta-ს აქვს მონაცემთა უზარმაზარი ცენტრები, მაგრამ ეს ცენტრები ძირითადად ეხება GPU-ს გამოთვლას, რაც საჭიროა Meta-ს სერვისების გასაძლიერებლად. GPU გამოთვლა ასევე აუცილებელი იყო Meta-ს რეკლამის განმსაზღვრელი მოდელისა და ალგორითმებისთვის, რომელიც გამოიყენება ქსელზე კონტენტის რეკომენდაციისთვის.

თუმცა, ATT-ის (Analytics and AI-based automation — ანალიტიკა და AI-ზე დაფუძნებული ავტომატიზაცია) გრძელვადიანი გამოსავალი არის ალბათური მოდელების შექმნა, რომლებიც არა მხოლოდ გაერკვევიან, თუ ვინ უნდა ამოიღონ მიზანში (რისთვისაც, სამართლიანად რომ ვთქვათ, Meta უკვე იყენებდა მანქანურ სწავლებას), არამედ იმასაც გაიგებენ, რომელი რეკლამები გადაკეთდა და რომელი არა. ეს ალბათური მოდელები აშენდება GPU-ების მასობრივი ფლოტით, რომლებიც Nividia A100-ის ბარათების შემთხვევაში ხუთნიშნა რიცხვი დაჯდება. ეს შეიძლება ძალიან ძვირი იყოს იმ სამყაროში, სადაც დეტერმინისტული რეკლამები მაინც უკეთესად მუშაობს, მაგრამ Meta იქ აღარ არის. 

უფრო მეტიც, იგივე მიდგომა არსებითი იქნება Reels-ის მუდმივი ზრდისთვის. კონტენტის რეკომენდირება უფრო რთულია მთელი ქსელისთვის, ვიდრე მხოლოდ მეგობრებისა და ოჯახის წევრებისთვის. განსაკუთრებით იმიტომ, რომ Meta გეგმავს რეკომენდირებას არა მხოლოდ ვიდეო, არამედ ყველა ტიპის კონტენტზე. ამ შემთხვევაშიც AI მოდელები იქნება გასაღები, ამ მოდელების აწყობა კი საკმაოდ დიდ თანხებთანაა დაკავშირებული.

თუმცა, გრძელვადიან პერსპექტივაში ეს ინვესტიცია შედეგს გამოიღებს. პირველ რიგში, საკმაოდ სარგებლიანია სამიზნე აუდიტორიის პირდაპირ ამორჩევა და ასე რეკომენდირება. ამასთან, AI მონაცემთა ცენტრების აშენების შემდეგ მათი შენარჩუნებისა და განახლების ფასი მათი პირველად აშენების ფასზე ბევრად ნაკლები იქნება. ასევე, ეს უზარმაზარი ინვესტიცია არის ის, რისი განხორციელებაც სხვა კომპანიებს არ შეუძლიათ, გარდა Google-ისა.

ბოლო პუნქტი, ალბათ, ყველაზე მნიშვნელოვანია: ATT-მ Meta უფრო მეტად დააზარალა, ვიდრე ნებისმიერი სხვა კომპანია, რადგან მას უკვე ჰქონდა ყველაზე დიდი და კარგად გამართული სარეკლამო ბიზნესი, მაგრამ გრძელვადიან პერსპექტივაში მან უნდა გააღრმაოს Meta-ს უფსკრული. ინვესტიციის მსგავსი დონე უბრალოდ არ არის სიცოცხლისუნარიანი ისეთი კომპანიისთვის, როგორიც არის Snap ან Twitter ან რომელიმე სხვა, რომელიც ასევე მუშაობს ციფრულ რეკლამაში (თუნდაც Snap ეყრდნობა ღრუბლოვან პროვაიდერებს საკუთარი მონაცემთა ცენტრების ნაცვლად); Meta იქნება საუკეთესო პლატფორმა რეკლამის განსათავსებლად.

Meta-ს ხელოვნური ინტელექტის მუშაობის მნიშვნელოვანი ფაქტორია არა უბრალოდ საბაზისო მოდელის შექმნა, არამედ მისი ინდივიდუალური მომხმარებლებისთვის მუდმივი ფუნქციონირება. ეს არის ის, რაც დაიტევს Meta-ს დიდ მოცულობას და კომპანიას დარჩება ერთადერთი საფიქრალი — როგორ მოახერხოს რეკლამის პერსონალიზაცია ეკონომიურად. Meta აგრძელებს საკუთარი სერვერის ჩიპების განვითარებას; კომპანიამ ასევე გამოუშვა ინსტრუმენტები Nvidia და AMD ჩიპების აბსტრაქციისთვის, თუმცა, როგორც ჩანს კომპანია მუშაობს საკუთარ AI ჩიპებზეც.

საინტერესო იქნება იმის დანახვა, თუ როგორ იმოქმედებს ისეთი რამ, როგორიცაა გამოსახულების და ტექსტის გენერაცია Meta-ზე გრძელვადიან პერსპექტივაში. Meta ინვესტირებას ახორციელებს AI-ში პერსონალიზებული რეკომენდაციების მისაცემად. 

საინტერესო იქნება, როგორ განვითარდება Meta-ს სარეკლამო ინსტრუმენტები: ასლის და სურათების გენერირების და A/B ტესტირების მთელი პროცესი შეიძლება განხორციელდეს ხელოვნური ინტელექტის საშუალებით, ხოლო Meta-ს ვერც ერთმა კომპანიამ ვერ აჯობოს შესაძლებლობები იმავე მასშტაბით ხელმისაწვდომი გახადოს. Meta-ს რეკლამის მიზანია მიაპყროს მომხმარებლის თვალი პროდუქტზე, სერვისზე ან აპლიკაციაზე, რომლის შესახებაც მანამდე არაფერი იცოდნენ. ეს კი AI-ს გამოყენებით, უფრო შესაფერის ფორმას მიიღებს.

Google

The Innovator’s Dilemma 1997 წელს გამოიცა. ეს იყო წელი, როდესაც Eastman Kodak-ის აქციამ თავის უმაღლეს ფასს — $94.25-ს მიაღწია ერთი შეხედვით კარგი მიზეზის გამო: Kodak, ტექნოლოგიის თვალსაზრისით, იდეალურად იყო აწყობილი. კომპანია არა მხოლოდ დომინირებდა ფილმების ტექნოლოგიაში, არამედ გამოიგონა ახალ ტალღად ქცეული ციფრული კამერა.

პრობლემა ბიზნეს-მოდელამდე დავიდა: Kodak-მა ბევრი ფული გამოიმუშავა ძალიან კარგი ზღვრებით ვერცხლის ჰალოიდის ფირის მიწოდებისას; ციფრული კამერებს არ სჭირდებოდათ ფირები. ამრიგად, Kodak-ის ხელმძღვანელობას დიდი სტიმული ჰქონდა, დაერწმუნებინა საკუთარი თავი, რომ ციფრული კამერები მხოლოდ მოყვარულთათვის იქნებოდა და მხოლოდ მაშინ, როდესაც ისინი შესამჩნევად გაიაფდებოდა, რასაც, რა თქმა უნდა, ძალიან დიდი დრო დასჭირდებოდა.

სინამდვილეში, kodak-ის მენეჯმენტი მართალი იყო: ციფრულ კამერას გამოგონების დროიდან 25 წელზე მეტი დასჭირდა, რომ გაყიდვებით ფირის კამერისთვის ეჯობნა. ციფრული კამერების პროფესიონალურ პროგრამებში გამოყენებას კიდევ უფრო მეტი დრო დასჭირდა. Kodak-მა ამასობაში ბევრი ფული გამოიმუშავა და მილიარდობით დოლარის დივიდენდი გადაიხადა. 2012 წელს კომპანიის გაკოტრება მომხმარებლის ციფრულ კამერებზე წვდომამ და ტელეფონში ჩაშენებულმა კამერებმა გამოიწვია.

აზრი, რომ ეს ბედნიერი დასასრულია, რა თქმა უნდა, საპირისპირო შეხედულებაა: უმეტესობა Kodak-ს წარუმატებლად მიიჩნევს, რადგან ჩვენ ველოდებით, რომ კომპანიები სამუდამოდ იარსებებენ. ამ თვალსაზრისით, Kodak არის გამაფრთხილებელი ამბავი იმის შესახებ, თუ როგორ შეუძლია ინოვაციურ კომპანიას მიიყვანოს თავისი ბიზნეს მოდელი საბოლოო გაწირვამდე, თუნდაც ეს გაწირვა მომხმარებლებისთვის უკეთესი პროდუქტის მიწოდებაზე გადიოდეს.

ამრიგად, ჩვენ მივდივართ Google-ის მიერ ხელოვნური ინტელექტის გამოყენებასთან. Google-მა გამოიგონა ტრანსფორმატორი, ძირითადი ტექნოლოგია, რომელიც ეფუძნება უახლესი ხელოვნური ინტელექტის მოდელებს. როგორც ამბობენ, Google-ს აქვს სასაუბრო ჩატის პროდუქტი, რომელიც ბევრად უსწრებს ChatGPT-ს. Google ამტკიცებს, რომ მისი გამოსახულების გენერირების შესაძლებლობები უკეთესია, ვიდრე Dall-e-ის ან ნებისმიერი სხვა მსგავსი გენერატორის, რომელიც ბაზარზე არსებობს. თუმცა, მსგავსი განცხადებები მხოლოდ განცხადებებად რჩება, რადგან ბაზარზე რეალური პროდუქტი არ არსებობს.

ეს გასაკვირი არ არის: Google უკვე დიდი ხანია, ლიდერობს მანქანური სწავლების გამოყენებაში. მისი მიზანი ძებნის პანელის და მომხმარებელთან დაკავშირებული სხვა პროდუქტების გაუმჯობესებაა. თუმცა, საძიებო სისტემა ყოველთვის ადამიანებზე იყო დამოკიდებული. Google უზრუნველყოფს ბმულებს, თუმცა, მომხმარებელი ირჩევს რომელი მათგანია საჭირო დაწკაპუნების საშუალებით. მსგავსი მიდგომა გავრცელდა რეკლამებზეც. სწორედ ის ადამიანები, რომლებთან მიღწევასაც რეკლამის განმთავსებლები ცდილობდნენ, წყვეტდნენ, იყო თუ არა რეკლამა საკმარისად კარგი დასაწკაპუნებლად.

გენერაციული ხელოვნური ინტელექტი, შესაძლოა, ძიების კონკრეტულ კონტექსტში წარმოადგენდეს გამრღვევ და არა მდგრად პროდუქტს. გამრღვევი ტექნოლოგია დასაწყისში არ არის ისეთი კარგი, როგორც უკვე არსებული. სწორედ ამიტომ, მენეჯერები ადვილად უარყოფენ მას და თავს არიდებენ ბიზნეს მოდელის გამოწვევებზე ფიქრს, საკუთარ თავს ეუბნებიან, რომ მათი ამჟამინდელი პროდუქტი უკეთესია. პრობლემა ის არის, რომ გამრღვევი პროდუქტი უმჯობესდება მაშინაც კი, როცა მდგრადი კომპანიის პროდუქტი უფრო ძველდება და ძნელად გამოსაყენებელი ხდება — ეს, რა თქმა უნდა, ძალიან ჰგავს Google Search-ის ამჟამინდელ მდგომარეობას.

Google-ის წარმომადგენლებს ChatGPT-ის მზარდი პოპულარობა აშინებთ
Google-ის წარმომადგენლებს ChatGPT-ის მზარდი პოპულარობა აშინებთ
თემის მიხედვით
Google-ის წარმომადგენლებს ChatGPT-ის მზარდი პოპულარობა აშინებთ
ChatGPT -  ხელოვნური ინტელექტის დახმარებით შექმნილი საუკეთესო ჩატბოტი
ChatGPT — ხელოვნური ინტელექტის დახმარებით შექმნილი საუკეთესო ჩატბოტი
თემის მიხედვით
ChatGPT — ხელოვნური ინტელექტის დახმარებით შექმნილი საუკეთესო ჩატბოტი

Microsoft

Microsoft, როგორც ჩანს, ყველაფერში საუკეთესოდაა განლაგებული. მას AWS-ის მსგავსად ღრუბლოვანი სერვისი აქვს, რომელიც GPU-ს ყიდის. ის ექსკლუზიური ღრუბლოვანი პროვაიდერია OpenAI-სთვის. ეს საკმაოდ ძვირი სიამოვნებაა, თუმცა, იმის გათვალისწინებით, რომ OpenAI-ს აქვს ხელოვნური ინტელექტის ეპოქის დიდი კომპანიების წევრობის სურვილი, Microsoft ინვესტიციას ახალი ეპოქის ინფრასტრუქტურაში დებს.

ამავდროულად, Microsoft Bing Mac-ის მსგავსია Iphone-ის გამოსვლისას. მას მოაქვს შემოსავალი, როგორც დომინანტი კომპანიის ნაწილს. თუმცა, Microsoft-ის მასშტაბის გათვალისწინებით, ეს თანხა მცირეა. თუ Bing-ში ChatGPT-ის მსგავსი შედეგების ჩართვა ამ ბიზნესმოდელს ბაზრის მასიური წილის მოპოვების შესაძლებლობას მისცემს, ამ რისკზე წასვლა აუცილებლად ღირს. 

ასევე, The information-ის უახლესი მოხსენების მიხედვით, GPT საბოლოოდ შემოდის Microsoft-ის პროდუქტებსა და აპლიკაციებში. ეს ხელოვნური ინტელექტის კოდირების ხელსაწყოს, GitHub Copilot-ის მიბაძვა იქნება. GitHub-მოახერხა, ყოფილიყო დამხმარე და არა ხელისშემშლელი ფაქტორი.

მნიშვნელოვანია, რომ ახალი ფუნქციების დამატება და მისი მოხმარებითვის გარკვეული თანხის გადახდა იდეალურად ერგება Microsoft-ის სააბონენტო ბიზნეს მოდელს. აღსანიშნავია, რომ კომპანია, რომელიც ოდესღაც განიხილებოდა, როგორც უაზრო ბანერი, არა მხოლოდ გახდება გამრღვევი ტექნოლოგიის მფლობელი, არამედ უფრო მაღალ მწვერვალებს დაიპყრობს. 

***

ხელოვნური ინტელექტის გარშემო ძალიან ბევრი საკითხი ერთიანდება. ამჟამინდელი პროგნოზები ბევრად უფრო შეზღუდული და მოკრძალებულია. დიდ კომპანიებში ხელოვნური ინტელექტის შესვლა, შესაძლოა, ახალი ეპოქის დასაწყისი იყოს. მაგრამ ტექნოლოგიაშიც კი ეპოქებს ათწლეული ან მეტი დრო სჭირდებათ, რათა გარშემო ყველაფერი გარდაქმნან.  

რატომ ტოვებენ თანამშრომლები დიდ ტექნოლოგიურ კომპანიებს
რატომ ტოვებენ თანამშრომლები დიდ ტექნოლოგიურ კომპანიებს
თემის მიხედვით
რატომ ტოვებენ თანამშრომლები დიდ ტექნოლოგიურ კომპანიებს
ვის ეკუთვნის საავტორო უფლებები AI-ით გენერირებულ ნამუშევრებზე
ვის ეკუთვნის საავტორო უფლებები AI-ით გენერირებულ ნამუშევრებზე
თემის მიხედვით
ვის ეკუთვნის საავტორო უფლებები AI-ით გენერირებულ ნამუშევრებზე
თორნიკე ქარჩხაძე სან დიეგოს უნივერსიტეტში AI-ს მუსიკის წერას ასწავლის
თორნიკე ქარჩხაძე სან დიეგოს უნივერსიტეტში AI-ს მუსიკის წერას ასწავლის
თემის მიხედვით
თორნიკე ქარჩხაძე სან დიეგოს უნივერსიტეტში AI-ს მუსიკის წერას ასწავლის


ასევე წაიკითხეთ
Calen AI - ხელოვნურ ინტელექტზე დაფუძნებული პირველი ქართულენოვანი ხმოვანი ასისტენტი
Calen AI - ხელოვნურ ინტელექტზე დაფუძნებული პირველი ქართულენოვანი ხმოვანი ასისტენტი
Calen AI - ხელოვნურ ინტელექტზე დაფუძნებული პირველი ქართულენოვანი ხმოვანი ასისტენტი
Google გეგმავს, საძიებო სისტემას ჩატბოტის ფუნქციები დაუმატოს
Google გეგმავს, საძიებო სისტემას ჩატბოტის ფუნქციები დაუმატოს
Google გეგმავს, საძიებო სისტემას ჩატბოტის ფუნქციები დაუმატოს
აშშ Google-ს სარეკლამო კონკურენტების „განდევნაში“ ადანაშუალებს
აშშ Google-ს სარეკლამო კონკურენტების „განდევნაში“ ადანაშუალებს
აშშ Google-ს სარეკლამო კონკურენტების „განდევნაში“ ადანაშუალებს
9 AI პლატფორმა, რომელიც 2023 წელს უნდა გამოსცადოთ
9 AI პლატფორმა, რომელიც 2023 წელს უნდა გამოსცადოთ
9 AI პლატფორმა, რომელიც 2023 წელს უნდა გამოსცადოთ
განხილვა
კომენტარები ჯერ არაა.