За последнее десятилетие технология компьютерного зрения совершила мощный технологический скачок. Теперь умные камеры научились распознавать объекты, что позволило успешно их применять в системах безопасности, устанавливать на автономные транспортные средства, сделать частью экосистемы “умный дом” и задействовать в других сферах. Стартап Bizdin.ai усовершенствовал компьютерное зрение с помощью технологий искусственного интеллекта и научил не только определять объекты, но и понимать увиденное. Например, если ИИ-камера зафиксирует драку в школьном коридоре, то она сразу поймет, что происходит, и автоматически сообщит об инциденте администрации. О возможностях технологии LVM (Large Vision Model) редакции ER10 Media рассказал CEO и основатель стартапа Bizdin.ai Айбек Нуртазаев.
Следите за развитием казахстанского стартап-движения в рубрике “100 стартап-историй Казахстана” — совместном проекте ER10 Media и Astana Hub. Мы рассказываем о достижениях казахстанских стартапов и показываем наиболее яркие проекты. Среди героев — участники Astana Hub, а также создатели других инновационных технологических продуктов и сервисов. Все материалы доступны на казахском, русском и английском языках.
ИИ: видит и понимает
— Расскажите, в чем заключается идея вашего стартапа? На каких технологиях он основан?
— Мы создаем ИИ-агентов “с глазами”, которые могут видеть мир фактически как человек. То есть камера с нашей ИИ-моделью не только распознает объекты, но и понимает происходящее. Более того, наша нейросеть способна описывать процессы, которые она видит. И здесь мы решаем две проблемы. Во-первых, мы осуществляем демократизацию компьютерного зрения, чтобы каждый человек мог “общаться” с любыми камерами и адаптировать их под свои нужды. Например, вы – директор школы. На территории учебного заведения установлены сотни камер. Вы можете давать им задание на обычном человеческом языке. Например, вы говорите или пишете задание: “Если ты увидишь драку, буллинг или курение, то сразу сообщи мне об этом инциденте”. Как только алгоритм фиксирует что-то из вышеназванного, он моментально оповещает вас.
Или, например, камера с ИИ-моделью может стать гидом в музее. Вы идете со смартфоном, наводите камеру на картину и нейросеть вам рассказывает интересную информацию об этом экспонате.
Также вы сможете общаться с ИИ-моделью. Допустим, вы находитесь в Сан-Франциско, наводите камеру на знаменитый мост Golden Gate Bridge, и нейросеть вам выдает всю информацию об этой достопримечательности. Или вы заходите в супермаркет, наводите камеру на полку и просите найти только вегетарианские или халал-продукты. Нейросеть с легкостью это сделает в режиме реального времени.
— И такую ИИ-модель можно установить на любое устройство с камерой?
— Да, алгоритм может быть подключен к камерам наблюдения или установлен на смартфон в виде такого полезного ИИ-ассистента. Более того, ИИ-алгоритм может анализировать видеоматериалы или фотографии. На данный момент наша LVM значительно превосходит возможности стандартного компьютерного зрения.
Востребованная технология
— В данный момент технология уже где-то используется?
— Да, у нас сейчас идет заключение контракта с казахстанским стартапом Parqour по обеспечению нашей технологией безопасных парковок. Также мы делаем пилотный проект с NARXOZ University. Там наши камеры оповещают родителей о том, что ребенок или студент благополучно добрался до школы или вуза. Также мы делаем аналитику. Если алгоритм видит, что учащийся несколько дней подряд приходит в плохом настроении, то мы оповещаем об этом психолога. Также камеры следят за порядком. Если случится какой-либо инцидент, они сразу сообщают администрации.
Далее есть команда, которая на основе нашей технологии делает очки для незрячих людей. То есть человек надевает такой гаджет и алгоритм помогает ему ориентироваться в пространстве, сообщая об окружающей обстановке или препятствиях.
Также мы делаем пилотные проекты в Гонконге, Сингапуре, на Филиппинах и в Малайзии. Постепенно выходим на рынок США.
Есть проект с АО “Самрук-Энерго” на стратегическом объекте. Там есть разные зоны, куда имеют доступ только определенные сотрудники. При помощи нашей технологии мы реализуем систему идентификации и пропуска. При этом мы просто даем свою технологию и не имеем доступа к их данным.
— Получается, что ваша технология лучше всего может показать себя в вопросах безопасности?
— Не совсем. Наша технология в принципе применима для любого анализа видеороликов, фотографий и картинок. Сейчас мы начинаем сотрудничать с фотостоком Getty Image в США. Там мы оптимизируем поиск изображений. Допустим, вам для рекламного баннера нужна картинка, где танцуют кошка с собакой, а их в это время снимает оператор в красном пиджаке. Если вы будете искать ее стандартным поисковиком, то это займет большое количество времени. Современные движки, заточенные на работе с SEO и тегами, не понимают тонких нюансов. Наоборот, наш алгоритм, понимающий контекст и смысл запроса, сможет быстро сделать анализ запроса и предоставить необходимое фото. Фактически это ChatGPT, только делающий упор на видео и изображения.
Нестандартная история успеха
— Как к вам пришла идея стартапа? Вы выявили боль рынка или сказался опыт?
— В целом, у нас совершенно нетипичная история и последовательность. Обычно люди проводят CustDev, находят проблему и придумывают, как ее решить. У нас все получилось иначе. Наша команда уже 6 лет работает в сфере ИИ. У нас уже есть несколько продуктов, таких как shyraq.ai и sellstat.ai. Но мы хотели создать настоящую disrupt-технологию, которая взорвет рынок. Мы понимали, что обычно научные исследования по разным технологиям появляются примерно за 10 лет до их коммерческого внедрения на рынке. Оценив свои силы, мы поняли, что можем развиваться по трем направлениям: AI, квантовые вычисления и космические технологии. Обдумав разные идеи, мы решили сконцентрироваться на ИИ-технологиях.
В тот момент OpenAI уже анонсировал ChatGPT, а мы решили запустить платформу, где каждый клиент может создать своего ИИ-бота. Мы это сделали, но буквально через месяц OpenAI представил свою платформу, с которой мы не могли конкурировать. Тогда мы запустили маркетплейс для продажи чат-ботов. Мы реализовали эту идею, у нас даже начались продажи, но OpenAI через месяц запустил такой же маркетплейс. Стало очевидно, что бы мы ни делали в сфере LLM, OpenAI все равно придет в этот сегмент и вытеснит нас.
Мы решили занять какую-то узкую нишу, где есть проблемы, но нет конкуренции с крупными компаниями. Обычно, если небольшой игрок решает боли рынка в определенном сегменте, то гиганты не идут на такой рынок, им проще купить конкурента. И тогда мы решили сделать фокус на видеоаналитику.
В тот момент нам серьезно повезло: мы сделали Exit из одной компании и у нас был некоторый стартовый капитал. Тогда в Казахстане был очень популярен майнинг. В какой-то момент криптовалюта Ethereum перешла c алгоритма Proof of Work на Proof of Stake, и все видеокарты, участвовавшие в майнинге Ethereum, оказались невостребованными. Благодаря этому мы смогли купить большой объем видеокарт в 5 раз дешевле рыночной цены. И мы поняли: “Класс! У нас есть куча видеокарт, и с ними надо что-то делать, например, обучать нейросети!”
— На какой стадии находится продукт? Насколько я понимаю, он уже рабочий.
— Да, продукт уже работает. Мы уже создали MVP. А теперь запускаем платформу, чтобы каждый человек смог быстро адаптировать ИИ-модель под свои нужды.
— Скажите, вам сейчас нужны инвестиции для развития стартапа?
— В целом, да. До этого мы развивали проект на собственные деньги. И сейчас мы нацелены на инвестиции в размере $5 млн. Конечно, мы сможем развиваться и без этих средств, но такие вложения позволили бы нам развиваться гораздо быстрее. Нам уже делали предложения. Например, в Казахстане был оффер на $1 млн. В Юго-Восточной Азии нам предлагали $8 млн за 40%-50% стартапа. Мы могли бы продать эту долю и начать быстро развиваться, но когда вы смотрите на долгосрочную перспективу и желаете стать единорогом, то продажа такой большой доли будет неоправданной.
— То есть у вас есть планы стать большим глобальным единорогом?
— Обязательно! Мы сфокусированы на этой цели. Могу еще сказать, что члены нашей команды — не совсем разработчики, а скорее исследователи. У нас есть несколько научных работ. ИИ-технологии очень быстро развиваются, и чтобы удерживать лидерство, нужно уделять серьезное внимание сфере R&D (research and development). Также мы хотели бы создать виртуальную студию, в которой компании и клиенты могли бы тренировать ИИ-модели под свои задачи, а затем обмениваться опытом, данными и наработками. Такая студия могла бы принести много пользы.
— У вас есть конкуренты?
— Да, мы их делим на две группы. У одних есть технологии LVM (Google, OpenAI), а другие специализируются на безопасности. От первых мы отличаемся тем, что никогда не передадим данные третьим лицам и можем организовать всю систему локально даже там, где нет интернета. От вторых мы отличаемся тем, что наши алгоритмы понимают контекст и наше решение можно адаптировать в любой отрасли.
Глобальная миссия
— Какую миссию вы видите в своем стартапе? Может быть, хотите реализовать какую-то мечту в своем проекте?
— Мы бы хотели, чтобы искусственный интеллект научился решать реальные проблемы мира. Сегодня мы живем в мире, где все основано на данных. Нейросети тогда показывают высокую эффективность, когда они обучены на высококачественных данных. Наша задача — научить ИИ видеть как человек, понимая окружающее. Тогда алгоритм станет очень полезным и сможет решать многие задачи. Камеры с ИИ смогут предотвращать преступления и катастрофы, помогать в исследованиях и делать очень много полезной работы.
— Вы проходили какие-нибудь тренинги или акселерации?
— Мы уже имели достаточный опыт, чтобы начать без акселераторов, но в расширении рассматриваем такие американские программы, как YC, HF0 и другие.
— Как давно вы в бизнесе? Работали когда-нибудь наемным работником?
— В бизнесе я с 2017 года. Стал предпринимателем сразу после окончания учебного заведения. Сейчас параллельно посещаю занятия в Стэнфорде.
— Вам нравится быть предпринимателем?
— Мне очень нравится быть не просто предпринимателем, а именно инженером-предпринимателем. Это как Илон Маск и Стив Джобс: когда ты не просто развиваешь бизнес, а создаешь новые технологии и, по сути, являешься новатором. И мне хочется создать что-то очень важное и нужное для людей.
— Хотите помочь развитию Казахстана?
— Безусловно! Я являюсь членом Qaz AI — Ассоциации по развитию искусственного интеллекта. Мы стараемся содействовать развитию ИИ в Казахстане и максимально поддерживаем стартапы в этой сфере.
Также я являюсь членом экспертного клуба при Сенате Парламента РК. Мы помогаем законодателям разобраться во всех вопросах, касающихся ИИ. Еще мы планируем поддерживать отечественные стартапы, чтобы они могли выходить на зарубежный рынок, а также будем привозить экспертов с мировым именем в нашу страну.
Помимо этого, мы разработали проект shyraq.ai, который помогает учителям готовиться к урокам, не тратя на этот монотонный процесс много времени.
Как видите, наша команда старается приносить пользу Казахстану.
— Чем вы вдохновляетесь в бизнесе? Есть любимые книги или фильмы?
— Честно, не успеваю читать художественную литературу. Что касается фильмов, то на первом месте стоит The Men Who Built America. Очень люблю фильмы про топовых предпринимателей. Также часто пересматриваю такие сериалы, как “Миллиарды”, “Форс-мажоры” и “Кремниевая долина”. Их я могу смотреть 10-15 раз, но не для развлечения, а именно как обучающий курс, потому что если вникать в детали, то там можно увидеть очень много полезного. А в остальном я получаю вдохновение от людей. Я люблю знакомиться и общаться.
— Какой вид спорта вы могли бы сравнить со своим бизнес-характером?
— Это парусный спорт! Это свобода, неограниченные пространства и красота. В Казахстане скоро откроется яхт-клуб Go Sail. Я, как участник этого клуба, хотел бы способствовать развитию этого спорта в Казахстане.