Ученые говорят, что человеческий мозг — это уникальный когнитивно-аналитический инструмент. Его возможности в познании, оценке и анализе окружающей информации еще очень долго не будут доступны для компьютеров в том же объеме и с тем же качеством. Больше других ученых интересую когнитивные возможности нашего мозга — исследователи хотят понять как наш мозг способен отличать речь от других звуков, классифицировать источник и направление звука.
Физики из Института им Макса Планка в немецком Лейпциге давно работают над системами, позволяющими компьютерам распознавать человеческую речь и транслировать ее в текст, однако успехи исследователей на этой почве были невелики. Сейчас здесь разработана новая математическая модель, способная улучшить автоматические процесс разпознавания и обработки человеческой речи. Авторы методики говорят, что в недалеком будущем такие алгоритмы приблизят машины к человеческому мозгу.
Немецкие инженеры говорят, что многие люди знают, что сложно компьютерам иметь дело с человеческой речью. «Человек, которому приходится общаться с автоматической телефонной системой, должен запастись терпением. Если вы говорите слишком быстро или слишком медленно, если ваше произношение не идеально четкое или если рядом с вами находится источник шума, то система вас не поймет», — говорит Стефан Кибель из Института Макса Планка.
Проблема современных систем распознавания голоса заключается в том, что они очень чувствительны к изменениям. Когда нынешние системы пытаются понять, что говорит человек, то они анализируют свою базу знаний, сравнивают частоты и звуковые комбинации, таким образом пытаясь найти совпадения.
Подробнее »