Інтелектуальна перевага: 10 кращих ai-сервісів і додатків

104

Бум технологій машинного навчання і систем штучного інтелекту (artificial intelligence, ai) на базі нейронних мереж привів до появи на софтверному ринку безлічі інноваційних додатків і сервісів, за функціональними можливостями на голову перевершують класичні програмні рішення. Ми вивчили асортимент “розумних” продуктів і вибрали серед них найоригінальніші розробки, скористатися якими може кожен.

Джерело зображення: gerd altmann / pixabay.com

# нейромережевий помічник для програмістів github copilot

Розробники: microsoft і openai. Сайт проекту: copilot.github.com.

Система на базі штучного інтелекту, яка може давати поради щодо написання коду розробникам програмного забезпечення. Являє собою результат спільних зусиль фахівців компанії microsoft і стартапу openai, що займається дослідженнями в області технологій електронного розуму.

Github copilot покладається на значний багаж знань в різних мовах програмування, алгоритмічних правилах, принципах і методах розробки пз. Інструмент виступає в якості напарника програміста: він аналізує існуючий і набирається код, коментарі до нього, місце розташування курсора і пропонує в залежності від контексту поради щодо доопрацювання тих чи інших рядків і функцій. У міру того, як програміст приймає або відхиляє пропозиції, покладена в основу сервісу ai-модель навчається, адаптується до стилю розробника і з часом стає ще більш розумною. Copilot інтегрований з широко затребуваним в професійному середовищі репозиторієм github і може використовуватися в середовищах розробки visual studio code, neovim, jetbrains. Система підтримує практично всі популярні мови програмування, але найкраще на даний момент працює з python, javascript, typescript, ruby і go.

Розробник: just ai. Сайт проекту: aimyvoice.com.

Платформа, що дозволяє створювати ші-моделі голосів різних персонажів або відомих особистостей і потім використовувати їх для синтезу мови в різних проектах, таких як озвучування ігор, аудіокниг, подкастів, голосових помічників, ботів, служб підтримки, вітальних листівок, реклами і багато чого іншого.

Щоб синтезувати голосову модель, необхідно зареєструватися на сайті aimyvoice і завантажити аудіофайл із записом голосу — свого собственноголибо конкретного персонажа або людини. При цьому запис повинен містити не менше 10 годин живої мови, а її обробка і навчання голосової моделі можуть зайняти близько тижня. Готову модель можна як застосовувати для особистих потреб, так і розмістити в каталозі сервісу для використання іншими користувачами.

Важливою особливістю платформи є захист інтересів правовласників, акторів і студій. Зокрема, можливості aimyvoice дозволяють визначати необхідність узгодження синтезованих голосових моделей з правовласниками та укладення договорів на їх використання з подальшим відрахуванням ліцензійних виплат. Наприклад, засобами сервісу можна без зусиль відтворити голос відомого кота матроскіна з простоквашино, що розмовляє вустами олега табакова, але для його використання потрібен дозвіл мультиплікаційної студії «союзмультфільм». Розробники проекту свято шанують копірайт, і така позиція заслуговує на повагу.

Розробник: deepl. Сайт проекту: deepl.com/translator.

Онлайновий перекладач, що підтримує 26 мов і 110 напрямків перекладу (мовних пар). Особливістю deepl translator є просунутий ai-движок, нейромережеві алгоритми якого навчені на основі мільйонів перекладених текстів різної тематики і вміють не тільки вловлювати зв’язок між словами, але і «розуміти» сенс пропозицій. Завдяки цьому і знанню лінгвістичних нюансів для кожної предметної області забезпечується максимально точний і коректний переклад, якість якого підтверджується численними порівняльними тестами і відгуками користувачів.

Сервіс дозволяє обробляти як звичайні тексти, так і файли pdf, word (.docx), powerpoint (.pptx) зі збереженням форматування документів. Взаємодіяти з перекладачем можна як з браузера, так і за допомогою клієнтських додатків, доступних для windows, macos і ios. Безкоштовна версія deepl translator має ряд обмежень, в тому числі за кількістю символів і обсягом перекладу. Для повноцінного використання сервісу пропонується оформити підписку, вартість якої починається від 6 євро на місяць. Також доступний api-інтерфейс для вбудовування перекладача в сторонні програмні продукти.

Розробник « “яндекс”. Сайт проекту: yandex.ru/company/technologies.

Значущих успіхів в стиранні мовних бар’єрів вдалося домогтися команді “яндекса”, активно вдосконалює власну технологію машинного перекладу відео, яка дозволяє дивитися з російською озвучкою ролики англійською, німецькою, французькою та іспанською мовами. Автоматичний закадровий переклад працює в ” яндекс.браузері ” для windows, macos, linux і android, а також у фірмовому додатку «яндекса» для ios і android. Щоб запустити переклад, потрібно натиснути на кнопку з логотипом ” яндекс.перекладач». Перекладати можна ролики, розміщені на youtube, vimeo, twitch і ще декількох популярних платформах. Головне, щоб відео знаходилося в загальному доступі, а його тривалість не перевищувала 4 годин.

У сервісі відеоперекладу задіяні відразу кілька технологій “яндекса” – в першу чергу це розпізнавання мови, синтез мови, біометрія і машинний переклад, в основу яких покладені складні нейромережеві моделі. Спочатку система розпізнавання мови перетворює сказане в кадрі в текст, розставляє розділові знаки і розподіляє слова за смисловими сегментами. Потім технологія машинного перекладу переводить отриманий текст на російську мову, а модуль синтезу мови озвучує результат, який накладається на відео таким чином, щоб фрази в оригіналі і в перекладі збігалися один з одним по довжині. Переклад, який виконує «яндекс», виходить двоголосим, з приглушеною оригінальною звуковою доріжкою. При цьому чоловічі голоси переводяться чоловічим голосом, жіночі-жіночим. У найближчих планах розробників-освоєння нових мовних пар і використання в системі перекладу більшої кількості голосів.

#

Розробники: sberdevices і sber ai. Сайт проекту: rudalle.ru.

Спільна розробка команд sberdevices і sber ai (входять в екосистему «ощад»), яка здатна створювати зображення на основі текстового опису російською мовою. Може бути використана як для оцінки можливостей штучного інтелекту, так і в практичних цілях, наприклад для генерації вільних від авторських прав і ліцензійних відрахувань ілюстрацій, які можна застосовувати в комерційних цілях.

Ai-система rudall-e розгорнута в хмарній інфраструктурі sbercoud, а для навчання покладених в її основу ші-моделей був задіяний суперкомп’ютер «крістофарі» (christofari), один з найбільш високопродуктивних обчислювальних комплексів в росії на даний момент. Створення зображень відбувається в три етапи: спочатку одна нейромережа аналізує текстовий запит і генерує задану кількість картинок, потім наступна вибирає, які з них найбільш вдалі і максимально відповідають опису, а третя збільшує їх в розмірі без втрати якості. Таким чином можна отримати необмежену кількість нових неповторяющихся зображень, що підходять під зазначені характеристики.

Розробник: sbermedai. Сайт програми: resp.sbermed.ai (доступні версії для android і ios).

Мобільна розробка компанії sbermedai (входить в екосистему «ощад»), яка за допомогою смартфона аналізує звуки дихання і кашлю людини на наявність патернів, характерних для коронавірусу. Ai resp використовує ai-модель, навчену на 3000 знеособлених записів хворих covid – 19 пацієнтів, а її точність визначення захворювання, як стверджується, досягає 82%. Незважаючи на такий високий показник, розробники чесно попереджають, що програма не є діагностичним засобом і не може замінити класичні лабораторні дослідження, тому при появі симптомів коронавірусу необхідно звернутися до лікаря.

В силу того, що магазини додатків google play і app store накладають певні обмеження на згадку covid-19 в назві і описі продуктів, в інтерфейсі ai resp мова йде про респіраторні захворювання в цілому. При цьому слід мати на увазі, що нейромережа програми навчена на зразках дихання і кашлю хворих коронавірусом і її основним призначенням є діагностика саме цьогоЗахворювання.

Розробник: sbermedai. Сайт програми: skin.sbermed.ai (доступні версії для android і ios).

Ще один мобільний інструмент підвідомчої» сберу ” компанії sbermedai, який на основі завантажених фотографій оцінює ймовірність наявності патології з 7 поширених типів захворювань шкіри. В основі ai skin лежать алгоритми штучного інтелекту, а надані програмою відомості носять виключно рекомендаційний характер і не є медичним висновком.

Ai skin розпізнає інтраепітеліальну карциному, актинічний і себорейний кератоз, базаліому, дерматофіброму, меланоцитарний невус, меланому і судинні висипання на шкірі. Для проведення діагностики необхідно за допомогою смартфона сфотографувати пошкоджену ділянку шкіри і завантажити зображення в додаток. Отриманий знімок ai-движок програми порівнює з базою з декількох тисяч клінічно підтверджених випадків новоутворень шкіри і видає результат в процентному співвідношенні. Для точної діагностики рекомендується звернутися до лікаря.

Розробник: nvidia. Сайт програми: nvidia.com/studio/canvas.

Програмна розробка для роботи з графікою, що дозволяє перетворювати грубі начерки в реалістичні пейзажі за допомогою штучного інтелекту, навченого більш ніж на 5 млн зображень.

Для роботи з nvidia canvas не потрібно зовсім ніяких художніх навичок і умінь: достатньо лише малювати мишею прості фігури і лінії за допомогою набору кистей, що імітують реальні текстури — траву, хмари, сніг, пісок, камені та ін. На основі начерків додаток миттєво створює зображення відповідно до задуму користувача. Всього програма підтримує накладення дев’яти стилів, які змінюють атмосферу зображення, і використання двадцяти кистей. Отриманий результат можна зберегти у вигляді psd-файлу для додаткової обробки в adobe photoshop. Поширюється додаток безкоштовно, однак для роботи з ним підійде не кожен комп’ютер. У системних вимогах canvas вказані ос windows 10 і відеокарти nvidia geforce rtx, nvidia rtx, titan rtx з встановленим драйвером версії 471.68 або пізніших випусків.

# сервіс nvidia image inpainting для розумного ретушування зображень

Розробник: nvidia. Сайт проекту: nvidia.com/research/inpainting.

Ще одна використовує ші-алгоритми розробка компанії nvidia, виконана у форматі онлайнового сервісу і дозволяє ретушувати зображення за допомогою “розумної” кисті. Image inpainting вміє відновлювати пошкоджені знімки з дефектами, може видаляти зайві об’єкти на фотографії, домальовувати відсутні фрагменти, а також згладжувати виділені області. Як і у випадку зі згаданою вище програмою canvas, від користувача при роботі з сервісом потрібно тільки маніпулювати пензлем — всі інші операції з графікою виконує штучний інтелект.

Розробник: meta. Сайт сервісу: sketch.metademolab.com.

Розробка інженерів лабораторії штучного інтелекту компанії meta (раніше відомої як facebook), яка анімує дитячі малюнки. Система аналізує зображення, створює примітивний “скелет” намальованого на ньому персонажа і змушує його досить правдоподібно рухатися.

В якості вхідних даних animated drawings використовує будь-який малюнок антропоморфного істоти. Зображення досить відсканувати або сфотографувати, після чого завантажити в систему, а потім дочекатися побудови моделі фігури — розпізнавання структури її кінцівок і зчленувань, на основі яких буде будуватися анімація. При необхідності отриманий результат можна підкоригувати вручну. Після цього залишиться тільки вибрати будь-яку з доступних схем анімації і отримати на виході готовий мультиплікаційний ролик, яким можна поділитися з сім’єю або друзями. За словами розробників, проект animated drawings є черговим кроком на шляху до створення штучного інтелекту, здатного бачити світ подібно людині. У майбутньому творці системи збираються розповісти про неї докладніше.

⇡# висновок

Технології штучного інтелекту удосконалюються бурхливими темпами, а машинне навчання і нейронні мережі з кожним роком знаходять нові сфери застосування в житті людини. Цифровий прогрес невблаганний, і яскравим підтвердженням цього факту служить наша добірка ai-рішень, що включає не лабораторні прототипи, а цілком робочі і доступні широкій аудиторії продукти. Індустрія ші знаходиться на порозі свого розвитку, і немає ніяких сумнівів в тому, що в найближчому майбутньому нас чекають цікаві новинки в даному сегменті і великі зміни на it-ринку.