Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла

Интернет с каждым днем ​​все больше напоминает самоорганизованный универсум, что эволюционирует с огромной скоростью. И хотя эта система еще не имеет полноценного искусственного интеллекта, зачатки его создания уже начинают появляться (например, виртуальный собеседник инф или Акинатор, который читает мысли, машинное зрение и голосовой интерфейс поисковых систем). В день, когда тест Тьюринга будет пройден и Интернет по функциональному инструмента превратится в незаменимого помощника, а для кого-то другая.

Кто стоит за всем этим? Безусловно, это сообщества людей.Сообщества, объединенные общими идеями, целями и интересами, которые готовы тратить свое время и ресурсы на осуществление этих идей. Поэтому, с каждым днем ​​в Интернете появляется все больше разумных программ, их функционал становится все шире, а посетители превращаются из потребителей в активных создателей контента.

Умные виртуальные собеседники

Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.ml

Виртуальный собеседник (бот-консультант) - это специалист технической поддержки, который доступен круглосуточно и мгновенно отвечает на вопросы пользователей. Он общается на естественном языке. Он может не только помочь что-то найти на сайте, но и предложить полезную для пользователя информацию или товар.Бот сохраняет заданные ему вопросы.Благодаря этому владелец сайта может узнать, что ищут на сайте, чего не хватает, что можно улучшить, какая аудитория клиентов.

Бот является встроенным модулем. Для просмотра модуль бота нужно вставить короткий специальный код на необходимые страницы сайта.Консультант может иметь стандартное оформление. Но он также может быть оформлен как индивидуальный персонаж для конкретного сайта.

Бота нужно научить отвечать на вопросы посетителей. Начальное обучение производится на основании первоначального словаря. В дальнейшем, анализируя диалоги клиентов и бота, владелец сайта может продолжить обучение самостоятельно.

Все шаги по настройке бота, размещение его базы знаний, сбора диалогов и т.д., компания разработчик делает самостоятельно. В случае каких-либо вопросов или необходимых доработок - компания-разработчик поддерживает работу Бота-консультанта.

Продукты компании «Наносемантика»

Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.mlhttp://www.nanosemantics.ru/

«Наносемантика» - лидер российского рынка технологий искусственного интеллекта, нацеленных на решение бизнес-задач. Компания с 2005 года занимается разработкой Инфив - виртуальных собеседников, управляемых искусственным интеллектом. «Наносемантика» развивает технологии и онлайн-сервисы, в основе которых лежит прямой диалог машины с пользователем.

  • WebMoney
  • Beeline Казахстан
  • Эlixir банк
  • Банк «Тинькофф Кредитные Системы»
  • NETBYNET Холдинг
  • «А-а-яй.ру»

ρБот-консультант для круглосуточной поддержки клиентов на сайте

Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.mlhttp://chatbot.tw1.ru/business.htm

Консультант, который способен работать 24 часа в сутки 7 дней в неделю без отдыха и перерывов на обед - мечта для сервисных компаний с большим количеством клиентов, которые задают одинаковые вопросы.

Услуги для поиска изображений по картинке

Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.mlИнтеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.mlИнтеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.mlИнтеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.ml
 

Первопроходцем была небольшая канадская компания Tineye, второй - Google, а третьей - китайский поисковик Baidoo. Яндекс стал четвертым игроком и надеется, что за ними подтянется Microsoft. Впрочем, в Tineye очень небольшая база картинок (3500000000), а в Baidoo сильный перекос в китайский рынок. Для украинского пользователя уместным будет использование поиска в Яндексе и Google: их база изображений составляет десятки миллиардов изображений.

Картинку на сервис можно загрузить одним из трех способов:
  • Ввести URL-адрес картинки и нажать на кнопку «Найти». Этот способ подойдет для поиска картинки, для которой известно ее адрес в Интернете.
  • Скачать картинку со своего компьютера.
  • Перетащить картинку с помощью мыши в указанное окно.
Зачем нужен сервис поиска похожей картинки?
  • Для дизайнеров, художников иногда важно найти похожую картинку или фото, но в другом ракурсе.
  • Сервис поможет найти сайт или Интернет-магазин, где можно найти или приобрести вещь, которая изображена на картинке.
  • Для поиска информации о некотором человеке, животном или архитектурном сооружении.
Картинка, по которой ищут подобные изображения должна соответствовать следующим требованиям:
  • Формат картинки - jpeg, gif, png,
  • Размер картинки не более 8 Мб.

Сервис поиска изображений используют алгоритмы анализа и классификации данных, а для поиска изображений по визуальному содержанию применяются технологии компьютерного зрения и описания содержания изображений. Данная технология превращает загруженную картинку в набор «визуальных слов». После этого система среди миллиардов картинок, которые содержатся в ее базе данных выбирает изображение, имеющие сходные «визуальные слова» и выдает их пользователю. При этом поиск займет не более минуты.

Задачи, которые решает группа компьютерного зрения:
  • Классификация изображений.
  • Поиск дубликатов и похожих изображений.
  • Распознавания текста.
  • Понимание сцены и распознавания объектов на изображениях.
В таком сервиса есть несколько сценариев использования:
  1. Поиск такой же картинки, но другой: высшего качества, большого размера, без водяного знака или, наоборот, фотожабы с ней.
  2. Узнать, кто находится на картинке, то есть определить изображение человека с текстовыми описаниями на сайтах.
  3. Отражать не картинки, а сайты, где они размещены. Например, по фотографии дизайнерского стула, дизнаетися, где его можно купить.

Компьютерное зрение

Александр Крайнов, менеджер проектов компьютерного зрения

Разработчики Яндекса разработали собственный алгоритм, который сильно отличается от аналогов. Использована Яндексом технология компьютерного зрения называется Content Based Image Retrieval (CBIR) и внутри компании носит название «Сибирь».

Опираясь на обобщенные пределы объектов, контрастные области и другие ключевые элементы картинки, робот создает свою библиотеку изображений, подобно как обычный поисковик скачивает упрощенные текстовые версии веб-страниц при индексировании, и уже по ней ведет поиск. Способность к обобщению уже показывает поиск: иногда находится не просто такая же картинка, а другое изображение, содержащее такой же объект.

Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.ml

Этот алгоритм лучше всего работает с URL-адресом картинки, а не загруженной с компьютера. То есть, когда исходная картинка размещена в Интернете, а не на компьютере пользователя. Поскольку поисковая база очертания предметов формируется изображений, которые уже проиндексированы системой, поэтому, если изображение отсутствует в поисковой базе, хорошего результата не будет.

В отличие от сервиса Google, который различает цвета, новый алгоритм Яндекса не различает цвета, но способен анализировать очертания предметов. После проведенного анализа формируется поисковый запрос для стандартного (словесного) поиска по изображениям. Исключение составляют торговые марки и шрифты - популярные логотипы, как правило, программа распознает. То же самое относится и к памятникам и архитектурных изображений. Поэтому, поиск архитектурного памятника по загруженной картинкой (фотографией) будет успешнее, чем поиск по фотографии домашнего праздника.

Стоит отметить, что поиск по картинкам от Google тоже часто работает некорректно - в результатах часто демонстрируются различные изображения с похожей цветовой гаммой. Впрочем, понятно, что данное направление только начинает развиваться. Яндекс пошел своим путем, не отставая при этом от других конкурентов. Дальнейшие разработки Яндекс продвигаются в том же направлении, что и Google, внедрил технологию Goggles в мобильный поиск. Google Goggles позволяют искать в реальном времени по изображению, которая берется из камеры смартфона.

Голосовой интерфейс Google

Благодаря Голосовом интерфейса можно диктовать запросы в клиентской программе на устройстве, а не вводить их. Чтобы транскрибировать продиктованы слова в написанный текст, Google направляет выражения серверы, где используется технология распознавания шаблонов .

Для того, научить систему лучше распознавать правильные поисковые запросы, Google сохраняет высказывания, чтобы улучшать службы, в частности: данные о языке, страну, выражение и предположения системы о сказанном. Сохранены аудиоданные не содержат идентификатор учетной записи Google, если пользователь этого не указал.

Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.ml

Для каждого языка Голосовой интерфейс Google собирает голосовые фрагменты, которые позволяют создать модели языка, которые обеспечивают корректную работу сервисов. Google имеет базу аудио образов, произносятся носителями языка, отличаются акцентами, возрасту и индивидуальным особенностям, произносить часто употребляемые фразы в различных акустических условиях, например, в ресторане, на улице или в машине. Для каждого языка Google создает словарь, содержащий более миллиона распознанных слов.

Сервис работает на основе системы Speech Input API, благодаря которой и реализуется голосовое управление Интернет-браузером. Сервис сейчас воплощено в Google Поиск, Google Переводчик, Cmail, Google Docs.

Голосовой поиск Google

Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.mlVoice Search - это расширение для Google Chrome, который позволяет осуществлять поиск или иные действия в Интернете с помощью своего голоса. На странице Google в строке поиска изображено иконку микрофона. Пользователь должен нажать на него и произнести громко и четко фразу или слово. Для получения озвученных ответов нужно использовать язык в соответствии с речевого интерфейса Google Chrome.

В случае запроса о заметных или общепризнанные объекты будет озвучена информация, которая берется из «Графа знаний» Google - базы, содержащей информацию о различных объектах, событиях и их связи между собой. Сведения из «графа знаний» обычно выводится справа от результатов поиска и предоставляет информацию по запросу, который ввел пользователь.

Это может быть, например, информация об актере, включая фильмы, в которых он снялся, и дату рождения. Озвучиванию будет подлежать, например, ответ на простые вопросы «Сколько долларов будет в 100 гривнах», «как называется столица Франции», «кто такой Мануэль Баррозу»

голосовой калькулятор

Поисковая система Google предлагает голосовой калькулятор Google , который позволяет с помощью устройств голосового ввода мгновенно получать ответ на любые, даже самые сложные расчеты.

Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.ml

Для запуска калькулятора нужно открыть Google Chrome и запустить google.com, лучше с открытым аккаунтом. Включаете устройство голосового ввода на компьютере и четко и ясно языком интерфейса Chrome произносите арифметическое действие. В поисковой строке появится калькулятор, на котором отображается действие и озвучено результат вычислений.

С калькулятором можно взаимодействовать вручную, мышкой или на цифровой клавиатуре набирая числа и переменные. В голосовом калькуляторе Google предусмотрено 15 алгебраических операций, со скобками, процентами, числом пи и е и другими переменными.

Голосовой переводчик Google

Google начал работы над универсальным переводчиком принципиально нового типа. Идея нового проекта заключается в создании сервиса, который позволит пользователям, общаются на разных языках, говорить друг с другом в режиме реального времени, причем именно «говорить», а не «переписываться». Иными словами переводчик должен распознать язык, перевести полученный в результате этого текст и воспроизвести его на другом языке.

Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.ml

Google Translate вполне успешно переводит тексты на 52 различных языка. Доработка уже существующих технологий до требуемого уровня займет еще несколько лет. Для перевода определенной фразы достаточно нажать на изображение микрофона в программе, сказать в микрофон нужные слова и программа автоматически отправит записанную речь на серверы Google, где состоится разбор звукового файла и перевод фразы. После текстового перевода можно прослушать произношение перевода и оригинального текста (синтезированный женский голос).

Google предупреждает, что пока функция носит экспериментальный характер, и не следует ожидать от нее 100% правильной работы.Правильном перевода могут помешать такие факторы как акцент, четкость произношения и посторонние шумы.

Ввод текста в сервисах Google

Для облачных сервисов Google применено несколько способов ввода текста. Сочетание редакторов IME или инструмента транслитерации ,виртуальных клавиатур и рукописного ввода позволяет поддерживать более 90 языков.

Как пользоваться различными способами ввода:
  • Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.ml Поиск Google
  • Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.ml Gmail
  • Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.ml Диск Google
  • Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.ml переводчик Google
  • Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.ml YouTube

Распознавания рукописного текста в сервисах Google

Компания Google добавила к популярным сервисам функцию распознавания рукописного текста. Например, в Google Translate появилось специальное поле, поддерживает рукописный ввод данных.Например там можно нарисовать иероглиф и моментально узнать его точно обозначения. Новая возможность пригодится европейцам и американцам, изучающих азиатские языки (проект концентрируется именно на языках азиатских групп) и не знают их хитроумную письменность. На сегодня существует возможность распознавания текстов на украинском языке

Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.ml

Для ввода текста можно использовать мышку или тачпад, где есть нормальная поддержка рукописного ввода текста. Для начала работы с рукописным вводом следует включить соответствующую функцию в Gmail. В Google Docs достаточно будет использовать комбинацию Ctrl + Shift + K.

Интеллект в интернет-технологиях. Распознавание изображений, речи, смысла - портал intellect.ml

Новинка Google будут поэтапно включать для разных регионов, поэтому, такая функция может быть и отсутствует у пользователя. Для тех, кто печатает быстрее, чем пишет, подобная функция будет не нужна. Для пользователей, которые печатают языках, символов в которой больше, чем содержит стандартная клавиатура, нововведение может оказаться полезным.

Распознавания лиц

https://support.google.com/plus/answer/2370300?hl=uk

Google вплотную занялась технологией распознавания лиц на фото. Для того, чтобы ускорить данный процесс, корпорация купила компанию PittPatt, которая занимается разработкой соответствующих технологий.PittPatt занимается не только распознаванием лиц на фотографиях, но и распознаванием фотографий вообще, с последующей разметкой (пометка) распознанных объектов.

Результаты разработок внедряются в различные программы и сервисы компании, как обычные, так и мобильные. Технология интегрируется в фото- и видеоприложения Picasa, Goggles, YouTube и Google+.

Комментарии (0)


avatar

Чтобы оставить комментарий войдите или зарегистрируйтесь






Распознавание образов