Поиск

Государственный Интернет-Сайт правовой информации

Проекты / Мониторинг культурных изменений

Информационные ресурсы

Тип:
Тема:

+
Дата с  
по  
Тип: Публикация
Тема: Повышение доступности информации и новые возможности её получения
Усиление роли киберпространства
Название: Hitachi разработала скоростной метод аудиопоиска
Дата: 10-10-2008
Автор: Рай Александр
Аннотация: Компания Hitachi разработала точный высокоскоростной метод поиска по ключевому слову в объемных архивах звуковых данных. Так, время от начала анализа до нахождения искомого слова в аудиофайле общей длительностью более 2 тыс. ч составляет всего три секунды.
Описание:

Добиться подобного результата инженерам Hitachi удалось благодаря совмещению сразу двух методов автоматического распознавания речи. Прежде всего применен так называемый метод фонематического поиска (фонема — минимальная значимая звуковая единицая языка). Распознавание происходит следующим образом: изначально звуковые сигналы конвертируются в определенную последовательность символов, затем сохраняется индекс, результирующий все данные о фонетической структуре сегмента. Именно на основе этого индекса происходит поиск.

Однако возможностей поиска, основанного на конвертации звука в последовательность символов, на практике не хватает: точность распознавания довольно низка. Поэтому метод комбинируется с другой технологией поиска — по акустическим характеристикам звука (долгота, тональность, частота). Впрочем, и он имеет свои недостатки: по мнению специалистов Hitachi, подобный глубокий анализ занимает недопустимо длительное время. Именно поэтому новая технология совмещает в себе возможности обоих поисковых методов и позволяет, несмотря на недостатки их раздельного использования, достичь очень быстрого и точного поиска.

Представители Hitachi отмечают, что технология найдет применение в различных сферах. Например, в потребительской среде поиск по ключевому слову в звуковых данных обеспечит быстрый доступ к фрагментам видеофайлов. Также инновационная технология может применяться в работе call-центров (для максимально быстрого доступа к записанным разговорам), полагают в Hitachi.

Ссылка: http://www.pcweek.ru/themes/detail.php?ID=114938
вернуться к поиску