moshekam: (Default)
[personal profile] moshekam

Microsoft: языковому барьеру – конец

Сегодня Microsoft опубликовала видео, в котором глава исследовательского отдела компании Рик Рашид демонстрирует технологию, позволяющую человеку разговаривать на чужом, незнакомом языке так же, как на своем собственном. 
Сначала докладчик показывает, как была улучшена технология распознавания и транскрибирования самой речи. Рик Рашид произносит слова, и с незначительной задержкой программа переводит их в текст. Надо сказать, результаты довольно впечатляющие. Задержка составляет одну-две секунды. Точность попадания вообще удивительная.


Несмотря на бурный прогресс компьютерных технологий, до недавнего времени процент ошибок в распознавании речи все равно был довольно велик. Рашид рассказал, что новые результаты были достигнуты благодаря технологии Deep Neural Network, разработанной в Университете Торонто. Не вдаваясь в подробности, он сказал, что для понимания речи исследователи попытались воспроизвести принцип работы нейронных сетей мозга. Видимо, удалось.
Это, между прочим, значит, что проблема перевода речи в текст уже скоро исчезнет вовсе, а вслед за этим начнет, вероятно, и отмирать навык быстрой печати и скорописи. Но речь не об этом.
Дальше Рашид переходит собственно к машинному переводу, который уже сейчас работает на довольно неплохом уровне, и нахваливает майкрософтовский Bing Translator. Он, говорит, работает в два этапа, сначала речь переводится буквально, а потом программа пытается понять смысл и пересказать на другом языке грамматически правильно. Это, конечно, можно сказать и про другие электронные переводчики, и главная проблема электронного перевода в том, что со смыслом у машины пока проблемы. Человек, который найдет и опишет алгоритм универсальной грамматики, станет, наверное, главным героем десятилетия. Однако, благодаря современным системам сбора и анализа лингвистических данных, компьютерный перевод, скажем, с английского на китайский уже действительно неплохо работает.
Это все понятные вещи, и даже третья составляющая – синтезатор речи с голосом конкретного человека – тоже уже не выглядит фантастикой, но в исследовательском отделе Microsoft разработали прототип программы, которая синтезирует твой голос на другом языке. В данном случае было использовано несколько часов записи с образцами китайского произношения и час записи самого Рашида. 
Все вроде понятно: складываем распознавание речи, электронный перевод, синтезатор речи – но то, что происходит на восьмой минуте записи, иначе как волшебством не назовешь. Рашид произносит фразу на английском языке, и с небольшой задержкой аудитория слышит его же, говорящим по-китайски.
Сам Рашид тут же оговаривается, что работы только начались, и до аппарата, который будет у вас в ухе разговаривать голосом знакомого китайца на русском, пройдет еще довольно много времени. Но, очевидно, ждать придется никак не сотни лет, и, скорее всего, даже не десятки. 
Языковой барьер, говорите?


Profile

moshekam: (Default)
moshekam

July 2017

S M T W T F S
      1
2345678
910111213 1415
16171819202122
23242526272829
3031     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 25th, 2026 07:25 am
Powered by Dreamwidth Studios