Кейінгі онжылдықта компьютердің көру технологиясы қуатты технологиялық сеспіліс жасады. Енді смарт камералар объектілерді тануды үйренді. Бұл оларды қауіпсіздік жүйелеріне сәтті пайдалануға, автономды көліктерге орнатуға, «ақылды үй» экожүйесінің бір бөлігіне айналдыруға және басқа салаларда пайдалануға мүмкіндік берді. Bizdin.ai стартабы жасанды интеллект технологиясын қолдана отырып, компьютердің көруін жақсартты және объектілерді анықтауды ғана емес, сонымен бірге көргенін түсінуді де үйретті. Мысалы, жасанды интеллект камерасы мектеп дәлізіндегі төбелесті түсіріп алса, ол не болып жатқанын бірден түсінеді және оқиға туралы әкімшілікке автоматты түрде хабарлайды. Bizdin.ai стартабының бас директоры және негізін қалаушы Айбек Нұртазаев ER10 Media редакциясына LVM (Large Vision Model) технологиясының мүмкіндіктері туралы айтып берді.
Қазақстандық стартаптар қозғалысы қалай дамып жатқанын «Қазақстанның 100 стартап тарихы» жобасынан бақылаңыз. Бұл – Er10 Media редакциясы мен Astana Hub-тың бірлескен жобасы. Біз еліміздегі стартаптардың жетістігін айтып, ең қызық жобаларды көрсетеміз. Кейіпкерлер арасында Astana Hub мүшелері, басқа инновациялық және технологиялық өнімдер мен қызметтер бар. Барлық материал үш тілде – қазақ, орыс, ағылшын тілдерінде жарияланады.
ЖИ көреді және түсінеді
— Айтыңызшы, сіздің стартабыңыздың идеясы қандай? Ол қандай технологияларға негізделген?
— Біз әлемді іс жүзінде адам сияқты көре алатын «көзі бар» ЖИ агенттерін жасаймыз. Яғни, біздің ЖИ моделі бар камера нысандарды танып қана қоймай, не болып жатқанын түсінеді. Сонымен қатар біздің нейрон желіміз өзі көрген процестерді сипаттай алады. Сонда біз екі мәселені шешеміз. Біріншіден, компьютердің көруін демократияландырып жатырмыз. Осылайша әр адам кез келген камерамен «сөйлесе» және оны өз қажетіне бейімдей алады. Мысалы, сіз мектеп директорысыз делік. Оқу орнының аумағына жүздеген камера орнатылған. Оларға қарапайым адам тілінде тапсырма бере аласыз. Мысалы, тапсырманы былай айтасыз немесе жазасыз: «Егер ұрыс-керіс, қорлау немесе темекі шегу оқиғаларын көрсеңіз, бұл оқиғаны дереу маған хабарлаңыз». Алгоритм жоғарыда аталғандардың кез келгенін анықтаған кезде дереу сізге хабарлайды.
Немесе, мысалы, ЖИ моделі бар камера музейде гид бола алады. Серуендеп келе жатып, смартфон камерасын ғимаратқа бағыттайсыз. Сол кезде нейрон желі сол жер туралы қызық ақпарат айтып береді. Оған қоса ЖИ моделімен байланыса аласыз.
Сан-Францискодасыз делік. Камераңызды атақты Golden Gate Bridge көпіріне бағыттағанда нейрон желі сізге осы туралы барлық ақпаратты береді. Немесе супермаркетке барып, камераңызды сөреге бағыттап, тек вегетариандық немесе халал өнімдерді табуды сұраңыз. Нейрон желі мұны нақты уақытта оңай жасайды.
— Ал мұндай ЖИ моделін камерасы бар кез келген құрылғыға орнатуға бола ма?
— Иә, алгоритмді осындай пайдалы ЖИ көмекшісі түрінде бақылау камераларына қосуға немесе смартфонға орнатуға болады. Сонымен қатар ЖИ алгоритмі видеоматериал мен фотоны талдай алады. Қазір біздің LVM стандартты компьютердің көру мүмкіндігінен әлдеқайда асып түседі.
Қажет технология
— Қазір технология бір жерде қолданылып жүр ме?
— Иә, біз қазір Қазақстанның Parqour стартабын технологиямыздың көмегімен жасаған қауіпсіз автотұрақпен қамтамасыз ету үшін келісімшарт жасасып жатырмыз. Сонымен қатар NARXOZ университетімен пилот жоба жасап жатырмыз. Онда біздің камералар ата-аналарға баланың немесе оқушының мектепке немесе университетке аман-есен барғанын хабарлайды. Сонымен қатар талдау жасаймыз. Егер алгоритм оқушының бірнеше күн қатарынан көңіл-күйінің нашар екенін көрсе, бұл туралы психологқа хабарлаймыз. Камералар да тәртіп сақтайды. Қандай да бір оқиға болса, олар дереу әкімшілікке хабарлайды.
Сосын біздің технология арқылы зағип жандарға көзілдірік жасайтын ұжым бар. Сонда адам гаджетті таққанда алгоритм оған қоршаған орта немесе кедергілер туралы хабар беріп, ғарышты шарлауға көмектеседі.
Сонымен бірге біз Гонконг, Сингапур, Филиппин және Малайзияда пилот жобаларды жүзеге асырып жатырмыз. АҚШ нарығына да біртіндеп еніп келеміз. «Самұрық-Энерго» АҚ-мен стратегиялық нысанда жоба бар. Кейбір қызметкерлерге ғана қолжетімді аймақтарға технологиямыздың көмегімен сәйкестендіру және қабылдау жүйесін енгіземіз. Бұл ретте жай ғана технологиямыздың мүмкіндігін қосып береміз, олардың деректері бізге қолжетімсіз.
— Сонда технологияңыз қауіпсіздік мәселесіне келгенде жақсы қызмет ете ме?
— Дәл бұлай емес. Біздің технологиямыз негізінен видеоларды, фото және суреттерді талдауға қолданылады. Біз қазір АҚШ-тағы Getty Image фото акционерлік қоғамымен ынтымақтасып жатырмыз. Онда фото іздеуді оңтайландырмақпыз. Мысалы, жарнама баннеріне қызыл күртеше киген оператор түсіріп жатқан мысық пен иттің билеп тұрған фотосы керек делік. Егер оны стандартты іздеу жүйесімен іздесеңіз, көп уақыт алады. SEO және тегтермен жұмыс істеуге бағытталған заманауи қозғалтқыштар нәзік нюанстарды түсінбейді. Керісінше, сауалдың контексті мен мағынасын түсінетін біздің алгоритм сұранысты жылдам талдап, қажет фотоны тауып бере алады. Бұл негізінен ChatGPT, бірақ бұл видео мен суреттерге баса назар аударады.
Жетістікке жету жолы ерекше
— Стартаптың идеясы қалай туды? Нарықтың проблемасын анықтадыңыз ба әлде оны тәжірибе көрсетті ме?
— Жалпы біздің оқиғамыз қарапайым емес. Әдетте адамдар CustDev жасайды, мәселені тауып, оны қалай шешуге болатынын анықтайды. Бізде бәрі басқаша болды. Біздің команда ЖИ саласында 6 жылдан бері жұмыс істейді. Shyraq.ai және sellstat.ai сияқты бірнеше өніміміз бар. Бірақ біз нарықты жарып жіберетін нағыз технологияны жасағымыз келді. Әдетте түрлі технологияны ғылыми түрде зерттеу олардың нарыққа коммерциялық тұрғыда енуіне дейін шамамен 10 жыл бұрын пайда болады. Өзіміздің күшті жақтарымызды бағалай отырып, үш бағытта дами алатынымызды түсіндік: ЖИ, квант есептеулері және ғарыш технологиясы. Түрлі идеяны талқылаған соң, біз ЖИ технологияларына назар саламыз деп шештік.
Осы кезде OpenAI ChatGPT-ді жариялаған. Ал біз әр клиент өзінің ЖИ-ін жасай алатын платформа жасаймыз деп шештік. Біз мұны жасадық та. Бірақ бір айдан кейін OpenAI өз платформасын ұсынды, біз онымен бәсекелесе алмадық. Содан кейін чат-боттарды сататын маркетплейс іске қостық. Бұл идеямызды жүзеге асырдық, тіпті сатуды да бастадық. Бірақ бір айдан кейін OpenAI дәл сондай маркетплейсті шығарды. LLM саласында не істесек те, OpenAI бәрібір осы сегментке келіп, бізді ығыстыратынын түсіндік.
Содан проблемасы бар, бірақ ірі компаниялармен бәсекелестік жоқ шағын саланы таңдадық. Әдетте, шағын ойыншы белгілі бір сегментте нарықтың мәселесін шешсе, онда алпауыттар мұндай нарыққа кірмейді, оларға бәсекелес сатып алу оңайырақ. Содан біз видеоаналитикаға назар салу туралы шешім қабылдадық.
Сол кезде біздің сәтіміз туды. Біз бір компаниядан Exit жасадық та, содан бастапқы капиталымыз болды. Ол кезде Қазақстанда майнинг ісі өте танымал еді. Бір сәтте Ethereum криптовалютасы Proof of Work алгоритмінен Proof of Stake алгоритміне ауысты да, Ethereum майнингіне қатысатын барлық видеокарта қажет емес болып қалды. Осының арқасында біз нарықтағы бағадан 5 есе арзанға үлкен көлемдегі видеокарталарды сатып алдық. Сонда біз «Керемет! Біздің көп видеокартамыз бар, мұны бірдеңеге жарату керек. Мысалы, нейрон желілерін үйрету керек!» деп ойладық.
— Өнім қай сатыда тұр? Түсінуімше, ол қазірдің өзінде жұмыс істейді?
— Иә, өнім жұмыс істеп тұр. Біз MVP құрдық. Енді әр адам ЖИ моделін өз қажетіне тез бейімдей алатын платформаны іске қосып жатырмыз.
— Қазір стартапты дамытуға инвестиция қажет пе?
— Жалпы, иә. Бұған дейін жобаны өз қаражатымызға әзірледік. Ал қазір 5 миллион доллар болатын инвестицияны мақсат етіп отырмыз. Әрине, бұл қаражатсыз дами аламыз, бірақ мұндай инвестиция бізге әлдеқайда жылдам дамуға мүмкіндік береді. Қазірдің өзінде ұсыныстар түсті. Мысалы, Қазақстанда 1 миллион долларлық ұсыныс болды. Оңтүстік-Шығыс Азияда стартаптың 40%-50%-ы үшін 8 миллион доллар ұсынды. Осы үлесті сатып, тез дамып кеуге болар еді. Бірақ ұзақмерзімді перспективаға қарап, жаһандық компания болғымыз келсе, мұндай үлкен үлесті сату ақталмайды.
— Демек жаһандық компания болу жоспарыңызда бар ғой?
— Міндетті түрде! Біз осы мақсатқа жұмылдық. Оған қоса біздің команда мүшелері нақты әзірлеушілер емес, оларды зерттеушілер деп айта аламын. Бірнеше ғылыми еңбектеріміз бар. ЖИ технологиясы өте жылдам дамып келеді және көшбасшылықты сақтау үшін R&D-ге (research and development) ерекше назар салу керек. Сонымен қатар біз компаниялар мен клиенттер ЖИ үлгілерін өз міндеттерін орындауға үйретіп, сосын тәжірибе әрі дерек алмаса алатын виртуалды студия құрғымыз келеді. Мұндай студия көп пайда әкелуі мүмкін.
— Бәсекелестеріңіз бар ма?
— Иә, біз оларды екі топқа бөлеміз. Кейбірінде LVM технологиялары бар (Google, OpenAI), ал басқалары қауіпсіздікке маманданған. Біріншісінен айырмашылығымыз – деректерді ешқашан үшінші тарапқа бермейміз және бүкіл жүйені интернет жоқ жерде де ұйымдастыра аламыз. Екіншісінен айырмашылығымыз – алгоритміміз контекстті түсінеді және шешімімізді кез келген салаға бейімдей аламыз.
Ғаламдық миссия
— Стартабыңыздың миссиясын қалай көресіз? Жобаңыз арқылы қандай да бір арманыңызды жүзеге асырғыңыз келмей ме?
— Жасанды интеллект әлемнің нақты мәселелерін шешуді үйренсе дейміз. Қазір біз бәрі дерекке негізделген әлемде өмір сүріп жатырмыз. Нейрон желілер жоғары сапалы деректерге үйретілген кезде көбірек өнімді болады. Біздің міндетіміз – ЖИ-ге қоршаған ортаны түсіне отырып, адам сияқты көруді үйрету. Сонда алгоритм өте пайдалы әрі көп есепті шешуге қабілетті болады. Жасанды интеллект камералары қылмыстар мен апаттардың алдын алуға, зерттеулерге және көп пайдалы жұмысты атқаруға көмектеседі.
— Қандай да бір тренингтен немесе акселерациядан өттіңіз бе?
— Акселераторсыз бастауға жеткілікті тәжірибеміз болды. Бірақ кеңеюге YC, HF0 және т.б. сияқты америкалық бағдарламаларды қарастырып жатырмыз.
— Кәсіпте жүргеніңізге қанша уақыт болды? Жалдамалы қызметкер болып көрдіңіз бе?
— 2017 жылдан бері кәсіптемін. Оқуды бітіргеннен кейін бірден кәсіпкер болдым. Оған қоса қазір Стэнфордтағы сабақтарға қатысып жүрмін.
— Сізге кәсіпкер болған ұнай ма?
— Маған жай кәсіпкер емес, инженер-кәсіпкер болған ұнайды. Бұл дегеніміз – Илон Маск пен Стив Джобс сияқты болу. Бизнесті дамытып қана қоймай, жаңа технология жасап, шын мәнінде инноватор болу. Мен адамдарға өте маңызды және қажет нәрсені жасағым келеді.
— Қазақстанның дамуына көмектескіңіз келе ме?
— Әлбетте! Мен Qaz AI – Жасанды интеллектті дамыту қауымдастығының мүшесімін. Қазақстанда жасанды интеллектіні дамытуға және осы саладағы стартаптарды барынша қолдауға тырысамыз.
Сонымен қатар Қазақстан парламенті сенаты жанындағы сарапшылар клубының мүшесімін. Біз заң шығарушыларға ЖИ-ге қатысты барлық мәселені түсінуге көмектесеміз. Оған қоса отандық стартаптар сыртқы нарыққа шығуы үшін қолдау көрсетсек деп жоспарлап отырмыз. Сонымен бірге елімізге әлемге әйгілі мамандарды да әкелеміз.
Бұдан бөлек мұғалімдерге осы монотонды үрдіске көп уақыт жұмсамай, сабаққа дайындалуға көмектесетін shyraq.ai жобасын әзірледік. Өзіңіз байқағандай, біздің команда Қазақстанға пайда әкелуге тырысып келеді.
— Кәсіпте сізді не шабыттандырады? Сүйікті кітаптарыңыз немесе фильмдеріңіз бар ма?
— Шынымды айтсам, көркем әдебиет оқуға уақытым жоқ. Киноға келсек, The Men Who Built America фильмі бірінші орында. Маған ең үздік кәсіпкерлер туралы фильмдер ұнайды. «Миллиардтар», «Форс-мажор» және «Силикон алқабы» сияқты сериалдарды да жиі көремін. Оларды 10-15 рет көре аламын, бірақ ойын-сауық үшін емес, тренинг курсы ретінде. Өйткені егжей-тегжейге тереңірек үңілсеңіз, көптеген пайдалы нәрселерді көруге болады. Ал қалған кезде адамдардан шабыт аламын. Адамдармен кездесіп, араласқанды жақсы көремін.
— Кәсіпкер мінезіңізді қандай спорт түрімен байланыстырасыз?
— Желкенді спорт! Ол – еркіндік, шексіз кеңістік және сұлулық. Жақында Қазақстанда Go Sail яхта клубы ашылады. Мен осы клубтың мүшесі ретінде Қазақстанда осы спорт түрін дамытуға үлес қосқым келеді.