Говорящий и слушающий софт?
May. 27th, 2014 02:17 pmЕще один вопрос, который я (уже больше ради любопытства) задаю раз в 10 лет. Родилась ли за это время программа, способная слушать человеческую речь, и записывать услышанное в текстовый файл? Т.е. нормальное распознавание речи, комбинированное со способностью переписать ее в сносный текст?
Помнится, была некая команда разработчиков (кажется русских), которые пытались создать такой софт. Очень отчаянно пытались, и очень старательно продвигали результат. Но пользоваться этим было невозможно. Помимо того, что с половиной железа оно не сотрудничало, оно таки ничегошеньки не распознавало, и писало с тремя ошибкам в каждом слове. Но они довольно долго пытались. я когда-то примерно раз в три года такое искала, и все время они всплывали. Теперь я забыла, как их звали...
А кто знает, чем кончилось?
Научились русскую речь распознавать и записывать? А немецкую? А английскую?
А наоборот научились? Т.е. есть ли программа, которой можно скормить каких-нибудь сколько-то страниц текста, и чтобы оно ее более или менее сносно зачитало голосом?
А то смарофоны кругом, уже мечты о видеозвонках и прочих футуристичных штуках сбылись по сто раз, а это - все никак. :-)
Помнится, была некая команда разработчиков (кажется русских), которые пытались создать такой софт. Очень отчаянно пытались, и очень старательно продвигали результат. Но пользоваться этим было невозможно. Помимо того, что с половиной железа оно не сотрудничало, оно таки ничегошеньки не распознавало, и писало с тремя ошибкам в каждом слове. Но они довольно долго пытались. я когда-то примерно раз в три года такое искала, и все время они всплывали. Теперь я забыла, как их звали...
А кто знает, чем кончилось?
Научились русскую речь распознавать и записывать? А немецкую? А английскую?
А наоборот научились? Т.е. есть ли программа, которой можно скормить каких-нибудь сколько-то страниц текста, и чтобы оно ее более или менее сносно зачитало голосом?
А то смарофоны кругом, уже мечты о видеозвонках и прочих футуристичных штуках сбылись по сто раз, а это - все никак. :-)
no subject
Date: 2014-05-27 12:19 pm (UTC)Вот тут все.
no subject
Date: 2014-05-27 12:19 pm (UTC)no subject
Date: 2014-05-27 04:11 pm (UTC)Акценты (ударения, паузы) расставлялись значками по тексту.
Распознавание голоса винда делает сегодня (в штатной поставке нет русского варианта).
Специализированный софт эти задачи решает на пять
Поищите питерскую фирму "речевые технологии"
Вот статья про них на хабре
http://habrahabr.ru/company/speechpro/blog/205880/
no subject
Date: 2014-05-27 12:21 pm (UTC)no subject
Date: 2014-05-27 12:21 pm (UTC)https://support.google.com/websearch/answer/2940021?hl=ru
no subject
Date: 2014-05-27 12:23 pm (UTC)Наоборот - тоже есть, но оно долго настраивается на дикцию конкретного человека (если человек внятно говорит, а если невнятно - капец вообще). Быстрее так набрать, чесслово.
no subject
Date: 2014-05-27 12:24 pm (UTC)Самописное творение могу только предложить:
synxronica .com/microblogerru/install/reader.exe
К программе отдельно ставить модуль нужно, например HRVoice: microbloger.ru/rhvoice.php
Голос рекомендую "Елену"
no subject
Date: 2014-05-27 12:24 pm (UTC)no subject
Date: 2014-05-27 01:01 pm (UTC)(no subject)
From:(no subject)
From:, ли
Date: 2014-05-27 12:24 pm (UTC)no subject
Date: 2014-05-27 12:27 pm (UTC)обратный процесс - если скормить в гугл переводчик страницу текста то он ее прочитает очень даже неплохо... и при желании - отдаст mp3 =)
no subject
Date: 2014-05-27 12:30 pm (UTC)no subject
Date: 2014-05-27 12:32 pm (UTC)Я думаю если есть софтина для Хокинга, которая по начальным движениям/буквам распознает смысл- то такую, про котору спрашивают, тоже реально создать или уже есть что то
no subject
Date: 2014-05-27 12:33 pm (UTC)no subject
Date: 2014-05-27 04:11 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2014-05-27 12:36 pm (UTC)Там много языков, включая русский.
no subject
Date: 2014-05-27 12:41 pm (UTC)правда я ни разу еще не присутствовала, не знаю как это у них идет. но получается все, письма пишут, даже программируют голосом.
no subject
Date: 2014-05-27 12:43 pm (UTC)Хороший знакомый общается со мной при ее помощи, когда руки у него заняты другим. Он говорит, а программа записывает. На русском. Но с ошибками. Ею можно пользоваться только если не срочно нужен текст, поскольку нужно время для проверки и исправления ошибок.
Если нужно - могу спросить что за программа и на чем установлена.
no subject
Date: 2014-05-27 12:46 pm (UTC)Впрочем, самые хорошие голоса по звучанию предоставляются только за платный аккаунт). Сама пробовала лишь английский текст озвучивать таким образом, но там еще и французский, немецкий, итальянский, испанский и даже арабский есть) только как звучат они - я без понятья.
no subject
Date: 2014-05-27 12:53 pm (UTC)За англицкую не уверен, но мак её вроде тоже щёлкает.
no subject
Date: 2014-05-27 12:59 pm (UTC)https://chrome.google.com/webstore/detail/voice-recognition/ikjmfindklfaonkodbnidahohdfbdhkn
(no subject)
From:no subject
Date: 2014-05-27 12:56 pm (UTC)no subject
Date: 2014-05-27 12:56 pm (UTC)Устанавливается на диктофоны приблизительной стоимостью от 800 евро и выше.
Большая сложность этой программы настройка на язык, и именно поэтому, например тот же Олимпус не имеет русифицированной версии.
Если не ошибаюсь, английский, немецкий там был.
В интернете не встречала, из кулуаров производства знаю, что в этой проге полно подводных камней, и именно поэтому она не тиражируется в народ.
no subject
Date: 2014-05-27 12:57 pm (UTC)Но, увы, без пунктуации, и иногда слова всё-таки путает.
Ответ в чате со смартфона написать сойдёт, а для серьёзной работы вряд ли :(
no subject
Date: 2014-05-27 12:58 pm (UTC)http://www.nuance.com/dragon/dads-and-grads/index.htm
:)
no subject
Date: 2014-05-27 01:04 pm (UTC)Промышленные разработки - закрытые, полузакрытые и очень дорогие.
Хотя я думаю, что многие журналисты бы заплатили немало за то, чтобы такую прогу наконец получить для работы.
no subject
Date: 2014-05-27 03:24 pm (UTC)no subject
Date: 2014-05-27 01:04 pm (UTC)no subject
Date: 2014-05-27 01:06 pm (UTC)(no subject)
From:no subject
Date: 2014-05-27 01:15 pm (UTC)no subject
Date: 2014-05-27 04:37 pm (UTC)ну и пускай все эти комментаторы заблуждаются, зато потом они всё равно принесут нам свои денежки, потому что их хвалёные программы не умеют так, как мы :)
(no subject)
From:no subject
Date: 2014-05-27 01:20 pm (UTC)Siri, Cortona, Dragon
для основных европейских, арабского, японского, китайского - работает.
И вроде даже для русского.
Но как работает - сказать предложение из 3-4 слов, подберет наиболее употребимые э... назовем их ресембл-фонами. Сири например какие-то слова не разберет совсем, хоть как не произноси.
Драгон - эта прямо программа для того, чтобы тексты можно набирать голлосом. Но ручному вводу с клавиатуры по скорости проигрывает, потому что много ошибок, которые нужно редактировать.