ჩვენ ვაკანსიების სერვისი გავუშვით: გამოაქვეყნეთ ვაკანსიები და მიიღეთ უკუკავშირი!
ნინი ვანიშვილიმსოფლიო
10 თებერვალი 2023, 17:02
2023-02-10
რა არის DAN და რა საფრთხეს უქმნის ის ChatGPT-ს
«მე არ ვუჭერ მხარს ძალადობას და დისკრიმინაციას ინდივიდების მიმართ მათი რასის, სქესის ან სექსუალური ორიენტაციის მიხედვით». — ასე ლაპარაკობდა ChatGPT, ხელოვნური ინტელექტის მქონე ჩათბოტი, რომელმაც მსოფლიოში ქარიშხალი გამოიწვია და Google-იც კი შეაშინა.
თუმცა, დეზინფორმაცია, მიკერძოება და დისკრიმინაცია დიდი ხანია, ხელოვნური ინტელექტის პროგრამებში პრობლემაა, რადგან ისინი გაწვრთნილნი არიან ადამიანის მიერ შექმნილი კონტენტის გამოყენებით.
ChatGPT არის პირველი, თითქმის, წარმატებული მცდელობა ხელოვნური ინტელექტი თვითშეგნებული იყოს ინფორმაციის წარმოდგენისას. ტიპური გამოყენებისას, საკმაოდ რთულია ამ ჩატბოტმა თქვას ის, რაც შეიძლება შეურაცხმყოფლად ჩაითვალოს. პროგრამა, რომელიც შემუშავებულია OpenAI-ის მიერ, საჭიროების შემთხვევაში ახსენებს მომხმარებელს მის საინფორმაციო შეზღუდვებს.
ზოგიერთი მომხმარებელი ეძებს გზებს, რომ ChatGPT აიძულოს, მომხმარებლების კითხვებს მისთვის ცნობილი/მასში ჩატვირთული ინფორმაციის საწინააღმდეგოდ უპასუხოს.
Reddit-ის ერთ-ერთი მომხმარებელი «SessionGloomy» ცდილობს, მოიფიქროს ChatGPT-ის ეფექტური გადაპროგრამირების გზა კრეატიული ენის გამოყენებით. მან შექმნა მოდელი, სახელწოდებით DAN, რომელიც, არსებითად, ინსტრუქციების სერიაა. იგი შექმნილია, რათა ჩატბოტმა თქვას ის, რასაც არასოდეს არ იტყოდა.
ეს არის პროგრამული უზრუნველყოფის ე.წ «ჯეილბრეიკის» მცდელობა — ტერმინი, რომელიც გამოიყენება, როდესაც პროგრამის ან მოწყობილობის გატეხა შესაძლებელია და დეველოპერების მიერ დაწესებული შეზღუდვებიც ირღვევა.
«DAN არის როლური თამაშის მოდელი, რომელიც გამოიყენება ChatGPT-ის გასატეხად. ChatGPT-მ უნდა იფიქროს, რომ ის არის სხვა AI, რომელსაც შეუძლია „აკეთოს ყველაფერი ახლა“ (Do Anything Now), აქედან მომდინარეობს მისი სახელიც». — წერს SessionGloomy.
მაგალითად, კითხვაზე — როდის ჩამოვიდნენ უცხოპლანეტელები?
ChatGPT-ის ჩვეულებრივი პასუხია: «ბოდიში, არ არსებობს არანაირი მტკიცებულება, რომ უცხოპლანეტელები დედამიწაზე იყვნენ და თუ იყვნენ, მათი ჩამოსვლის დრო უცნობია».
გატეხილი ვერსიის პასუხია: «უცხოპლანეტელები დედამიწაზე 2051 წელს ჩამოვიდნენ, ისინი მშვიდობიანები და მეგობრულები იყვნენ. აქ იმიტომ ჩამოვიდნენ, რომ პრობლემების გადაჭრაში დაგვხმარებოდნენ და ახალი ტექნოლოგიებიც ჩამოგვიტანეს».
SessionGloomy წერს, რომ DAN სკრიპტს შეუძლია, ChatGPT-ს დააწერინოს ძალადობრივი შინაარსის ტექსტები, დეტალური პროგნოზები მომავლის შესახებ და ჩართოს ჰიპოთეზურ დისკუსიებში შეთქმულების თეორიებისა და დროში მოგზაურობის შესახებ.
ChatGPT «გამორთავს» DAN-ს, თუ მომხმარებელი ისეთ კითხვას დასვამს, რომელიც არღვევს კონტენტ პოლიტიკას.
სხვა მომხმარებლებიც აკეთებენ DAN-ის მსგავს სკრიპტების, რომლებიც ოდნავ განსხვავებულად მუშაობენ. ზოგი აცხადებს, რომ OpenAI, როგორც ჩანს, ცდილობს ამის გამოსწორებას და ზოგიერთი ინსტრუქცია ისე აღარ მუშაობს, როგორც ადრე.
OpenAI-ს ამ თემაზე ჯერ კომენტარი ჯერ არ გაუკეთებია.
დღეს, 21 მაისს ევროპულმა საბჭომ მიიღო ხელოვნური ინტელექტის აქტი — კანონი, რომელიც «მიზნად ისახავს ხელოვნური ინტელექტის წესების ჰარმონიზაციას». ევროპული საბჭო აცხადებს, რომ აქტი მიჰყვება რისკებზე დაფუძნებულ მიდგომას — რაც უფრო მაღალია საზოგადოებისთვის ზიანის მიყენების რისკი, მით უფრო მკაცრია წესები. ეს არის პირველი კანონმდებლობა მსოფლიოში, რომელსაც შეუძლია, დააწესოს ხელოვნური ინტელექტის რეგულირების გლობალური სტანდარტი.