Распознавание речи. Какое текущее состояние?

Реально работающие приложения, программные и программно-аппаратные продукты.

Модераторы: DCV, Dimmy, daner, victorst, Администраторы

Сообщение Tester » Пт окт 30, 2009 21:26:26

Пишу на Делфи. Использую максимально API Windows. Уже есть нашел чужие исходники по записи в wav c микрофона, не провереные исходники разложение на Ферма (новый делфи не правильно работает со старыми исходниками - даже не могу посмотреть). Если программа получиться, то переведу его на С (будет повод выучить его :roll: )
Андрей
Аватара пользователя
Tester
Серьёзный посетитель
 
Сообщения: 101
Зарегистрирован: Пн янв 10, 2005 15:35:11
Откуда: Украина

Сообщение DK_sensey » Пт окт 30, 2009 22:04:14

Я тоже пишу на Delphi.
DK_sensey
Серьёзный посетитель
 
Сообщения: 133
Зарегистрирован: Пт июл 17, 2009 16:50:14
Откуда: Беларусь

Сообщение Tester » Сб окт 31, 2009 10:58:22

Почти год назад перешел с Delphi7 на Delphi2009 - там появилась поддержка юникода! Столько проблем было при переводе старых исходников... Полетели почти все обращения к обычным строкам, прочитанных из файлов и символами, которые теперь занимают 2 байта! Но мой редактор, специально написанный для ИИ теперь может поддерживать даже китайские иероглифы одновременно с арабским и руским! :)
Андрей
Аватара пользователя
Tester
Серьёзный посетитель
 
Сообщения: 101
Зарегистрирован: Пн янв 10, 2005 15:35:11
Откуда: Украина

Сообщение DK_sensey » Сб окт 31, 2009 14:53:51

А мне вот надоел Delphi. Да и вообще алгоритмические языки. Логические как альтернатива тоже сильно не устраивают. Вот и пишу свою систему.
DK_sensey
Серьёзный посетитель
 
Сообщения: 133
Зарегистрирован: Пт июл 17, 2009 16:50:14
Откуда: Беларусь

Сообщение Virtual_Graph » Сб окт 31, 2009 16:17:25

DK_sensey, может быть попробуем посотрудничать?
Просто я вижу, как вы движетесь в глубь, а я - в ширь :)
Справедливости ради могу сказать, что я углубился в модель нейрона.
Эка невидаль, - скажете вы, но... модель-то не банальная :roll:

Если интересно, то аннотация доклада: http://forum.aicommunity.org/viewtopic. ... 5345#55345
Еще из той же серии: http://artmind.build2.ru/viewtopic.php?id=34

Последний рисунок - ии-архитектура верхнего уровня :arrow:
Virtual_Graph
Заинтересованный
 
Сообщения: 60
Зарегистрирован: Сб окт 13, 2007 12:39:10

Сообщение DK_sensey » Сб окт 31, 2009 17:54:01

Я теперь определился когда я смогу вообще сотрудничать с кем либо - когда у меня появится время. В свою очередь это определяется тем насколько мне удастся высвободиться из бесконечных трудов+от того насколько мощный инструмент я получу в свое распоряжение в результате этих трудов.

Дело в том что я уже не рассуждаю как в 16 лет - "я могу написать любую программу". Теперь я рассуждаю иначе - "я могу написать любую программу если на это мне потребуется не больше чем 1 (один) день". Я свое время ценю очень дорого.

Но все это не повод для пессимизма - время у меня ОБЯЗАТЕЛЬНО появится и сотрудничать я обязательно буду! :)
DK_sensey
Серьёзный посетитель
 
Сообщения: 133
Зарегистрирован: Пт июл 17, 2009 16:50:14
Откуда: Беларусь

Сообщение Virtual_Graph » Сб окт 31, 2009 18:11:19

Понимаю вас, понимаю...
Вот только мои идеи относятся как раз к автоматизации этих самых трудов.
Хотя, не думаю, что это отменит НС-программирование, как таковое.
Ибо это позволяет настраивать НС с любыми параметрами (которые мы только посчитаем целесообразным ввести в модель нейрона).
И это не банальный Back Prop. Удачи вам в трудах своих :arrow:
Virtual_Graph
Заинтересованный
 
Сообщения: 60
Зарегистрирован: Сб окт 13, 2007 12:39:10

Сообщение DK_sensey » Сб окт 31, 2009 20:27:13

Я почитаю ваши работы.

Добавлено спустя 9 минут 34 секунды:

Посмотрел вашу схему - интересно. Впринципе я предполагал что на любом этапе развития моей системы ее можно будет организовать в самостоятельно функционирующую схему и получить некий самостоятельный ИИ некоторого уровня. Возможно ваша схема мне и пригодится. Вообще я еще когда прорабатывал теорию, перед тем как начинать строить свою систему, я тоже предполагал некий возможный вариант схемы, наподобие вашей. Но только я предполагал множество различных схем. И на самом деле в этом проблем нет. Когда я закончу свою систему я смогу за один день реализовать вашу схему:) А за другой день другую схему:) Я смогу оперировать абстрактными высокоуровневыми категориями как лаконичными описаниями, наподобие вашей схемы, и мне не придется трать по полгода каждый раз чтобы попробовать новую схему.
DK_sensey
Серьёзный посетитель
 
Сообщения: 133
Зарегистрирован: Пт июл 17, 2009 16:50:14
Откуда: Беларусь

Сообщение Tester » Сб окт 31, 2009 21:32:23

А мне вот надоел Delphi. Да и вообще алгоритмические языки. Логические как альтернатива тоже сильно не устраивают. Вот и пишу свою систему.


А я верю а будущее алгоритмических языков! Пишу тоже свою систему, направленную на саморазвивающиеся алгоритмы. Написал свой язык, чем-то напоминающий паскаль, бейсик, асемблер. Уже работает, но я понял одно золотое правило: "среда тогда имеет право на жизнь, когда у нее есть много пользователей". А значит мою среду приходится маскировать под невинную внешнюю программу, которая должна обойти конкурентов, хотя-бы по нескольким пунктам. Вот когда хотя-бы догоню кого-нибудь из них, тогда можно будет раскрывать "дополнительные" возможности. Пока решил передохнуть, отвлечься, но не сильно. Поэтому и занялся звуком, который потом можно будет встроить "плагином" в мой язык. :)
Теоретически потом смогу потом НА МОЕМ ЯЗЫКЕ написать систему работы с нейронными сетями или (и) использовать чужие наработки как плагины. То-же касается генетических алгоритмов, баз знаний и вообще практически ВСЕХ направлений ИИ.
Андрей
Аватара пользователя
Tester
Серьёзный посетитель
 
Сообщения: 101
Зарегистрирован: Пн янв 10, 2005 15:35:11
Откуда: Украина

Сообщение DK_sensey » Вс ноя 01, 2009 9:14:36

А я верю а будущее алгоритмических языков! Пишу тоже свою систему, направленную на саморазвивающиеся алгоритмы

Я тоже верю, примерно так же как верю в будущее транзисторов:) Они никуда не исчезнут в будущем. Однако я не собираюсь больше тратить ГОДЫ на написание программ на алгоритмическом языке если у меня появилась возможность потратить день на написание "программы" на очень высокоуровневой системе ИИ, а алгоритм генерируется уже системой полностью автоматически. Распознавание текстов, звуков и т.п. - это лишь часть моих замыслов. Другая часть - обучить систему генерации оптимального программного кода для графического интерфейса пользователя. Дело в том что умное ядро программ как правило занимает меньше труда чем написание графического интерфейса пользователя. Мне так надоело тратить время на эту рутину что я хочу полностью переложить эту работу на машину и сконцентрироваться только на внутренней интеллектуальной части приложений. Система должна сама выбрать оптимальную структуру окон, меню, элементов управления в формах - исходя из смысла тех данных которыми пользователь будет управлять при помощи этого графического интерфейса, вплоть до того чтобы соблюсти правила дизайна и визуальной эстетики - это на нейронных сетях делается без проблем. Это можно автоматизировать и больше не тратить время программиста на эту работу.
DK_sensey
Серьёзный посетитель
 
Сообщения: 133
Зарегистрирован: Пт июл 17, 2009 16:50:14
Откуда: Беларусь

Сообщение Virtual_Graph » Вс ноя 01, 2009 12:13:02

DK_sensey писал(а):Распознавание текстов, звуков и т.п. - это лишь часть моих замыслов.

Распознавание - это хорошо.
Но это всего лишь этап многоступенчатого процесса.
И эффективность распознавания определяется все цепочкой: А :arrow: В :arrow: С :arrow: D
DK_sensey писал(а):...мне не придется трать по полгода каждый раз чтобы попробовать новую схему.

Для этого вам придется программировать крупными блоками.
И создавать крупные тракты связей. Не заморачиваясь в деталях.
А для этого необходимо уметь настраивать структуру сети. У меня есть свое решение
по этому поводу, но мне любопытно, как это решили вы :)
DK_sensey писал(а):Возможно ваша схема мне и пригодится.

Возможно... вы думаете, что обладаете монополией на истину? У вас лишь кусочек истины.
И у меня кусочек. У вас большой кусочек? Заверяю, у меня не меньше :)
Просто я вам предложил объединить кусочки... но если нет времени... то нет проблем... :shock:
А схемка - так... один из уровней...
Virtual_Graph
Заинтересованный
 
Сообщения: 60
Зарегистрирован: Сб окт 13, 2007 12:39:10

Сообщение Tester » Вс ноя 01, 2009 16:57:19

Возможно... вы думаете, что обладаете монополией на истину? У вас лишь кусочек истины.

У каждого своя истина, своя конечная цель! Кто-то мечтает что-то доказать себе и окружающим. Кто-то влез в эту тему для саморазвития. А кто-то планирует использовать результат для зарабатывания денег, продав продукт или даже идею...
У меня идея созревала не меньше 5 лет, пока я накапливал информацию, анализировал чужие методы, переваривал их, склеивая вместе в разных комбинациях. И еще около 4 лет на написание своей программы. Неужели я НЕ заслужил на свою истину? :wink: Или Вы верите, что я физически смогу открыть ВСЮ идею из нескольких мегабайт текстовых исходников с расширением PAS всего в нескольких строчках форума? А если мою схему, взятую с форума, кто-нибудь использует для расширения своей программы, я не обижусь! :)
Я планирую продавать программы на основе своей схемы. Поэтому делиться исходниками ядра не планирую. Разве что промежуточными результатами плагинов. Даже язык будет зашифрован на первых порах, и по моим планам лет 10 никто кроме авторов его не будет даже видеть! И объяснение тоже крайне простое: То что я писал 4 года один, Майкрософт, Гугл, Эпл, Абби и любая крупная компания с командой в несколько десятков программистов напишут ее за несколько месяцев. А потом начнут обгонять меня "семимильными шагами". Достаточно чтобы один из их сотен менеджер предположил что "программу, похожую на эту мы бы продавали намного быстрее, и заработали бы на этом намного больше"... Обидно! Правда?

Когда-то я поднимал здесь (и не только здесь) тему, как разделить прибыли по продаже программы между разработчиками разделенными большим расстоянием и интернетом. Самым умным советом было - создать фирму, заключать договора с физическими особами - тогда у физ особ будет хоть какой-нибудь шанс подать на Вас в суд и вернуть свой заработок...

Поэтому не пытайтесь предлагать объединяться, прежде чем не выясните что "вторая половинка" ТОЖЕ не хочет на этом зарабатывать... :twisted:
Андрей
Аватара пользователя
Tester
Серьёзный посетитель
 
Сообщения: 101
Зарегистрирован: Пн янв 10, 2005 15:35:11
Откуда: Украина

Сообщение DK_sensey » Вс ноя 01, 2009 17:28:32

Просто я вам предложил объединить кусочки... но если нет времени... то нет проблем...

Не торопите меня, у меня дел выше крыши, я просто физически не в состоянии сделать все в один момент. Когда будут готовы возможности для объединения - тогда и объединимся. А пока - работать, работать и работать.
DK_sensey
Серьёзный посетитель
 
Сообщения: 133
Зарегистрирован: Пт июл 17, 2009 16:50:14
Откуда: Беларусь

Сообщение Virtual_Graph » Вс ноя 01, 2009 17:38:18

Tester писал(а):У каждого своя истина, своя конечная цель! Кто-то мечтает что-то доказать себе и окружающим. Кто-то влез в эту тему для саморазвития. А кто-то планирует использовать результат для зарабатывания денег, продав продукт или даже идею...

Я не про цели, а про истину. Реальность сложна и требует разных подходов. Разных точек зрения. Их объединение - благо.
Сэнсей просто создал иерархический анализатор среды. Где нейроны, распознающие примитивы низкого уровня подают
свои сигналы на примитивы более высокого уровня (3-5 уровней) и так до абстракций. Думаю, сделано это для плоских изображений.
Но это только этап. Конечно, хочется извлечь из него максимум дензнаков. И это конечная цель?
Tester писал(а):У меня идея созревала не меньше 5 лет, пока я накапливал информацию, анализировал чужие методы, переваривал их, склеивая вместе в разных комбинациях. И еще около 4 лет на написание своей программы. Неужели я НЕ заслужил на свою истину? :wink: Или Вы верите, что я физически смогу открыть ВСЮ идею из нескольких мегабайт текстовых исходников с расширением PAS всего в нескольких строчках форума? А если мою схему, взятую с форума, кто-нибудь использует для расширения своей программы, я не обижусь! :)

Я занимаюсь этим 20 лет. Ничего особенного. И у меня так же есть свой софт на С++.
И я тоже не собираюсь его раздавать. А заслужил ты чего-там, или нет, этого никто не знает...
Просто многие вот так сидят на каких-то своих найденных изюминках и думают про дензнаки :cry:



Я планирую продавать программы на основе своей схемы. Поэтому делиться исходниками ядра не планирую. Разве что промежуточными результатами плагинов. Даже язык будет зашифрован на первых порах, и по моим планам лет 10 никто кроме авторов его не будет даже видеть! И объяснение тоже крайне простое: То что я писал 4 года один, Майкрософт, Гугл, Эпл, Абби и любая крупная компания с командой в несколько десятков программистов напишут ее за несколько месяцев. А потом начнут обгонять меня "семимильными шагами". Достаточно чтобы один из их сотен менеджер предположил что "программу, похожую на эту мы бы продавали намного быстрее, и заработали бы на этом намного больше"... Обидно! Правда?

Когда-то я поднимал здесь (и не только здесь) тему, как разделить прибыли по продаже программы между разработчиками разделенными большим расстоянием и интернетом. Самым умным советом было - создать фирму, заключать договора с физическими особами - тогда у физ особ будет хоть какой-нибудь шанс подать на Вас в суд и вернуть свой заработок...

Поэтому не пытайтесь предлагать объединяться, прежде чем не выясните что "вторая половинка" ТОЖЕ не хочет на этом зарабатывать... :twisted:[/quote]
Virtual_Graph
Заинтересованный
 
Сообщения: 60
Зарегистрирован: Сб окт 13, 2007 12:39:10

Сообщение DK_sensey » Вс ноя 01, 2009 17:51:25

Возможно... вы думаете, что обладаете монополией на истину?

Абсолютно так не думаю.

У вас лишь кусочек истины.
И у меня кусочек.
Полностью согласен.

У вас большой кусочек? Заверяю, у меня не меньше

Это хорошо. Но дела не меняет. Я сейчас не в состоянии объединяться.

Добавлено спустя 57 секунд:

У вас есть идеи - отлично, дайте ссылки, я с ними ознакомлюсь - это максимум что я могу обещать вам именно сейчас.

Добавлено спустя 7 минут 1 секунду:

Tester
Я планирую продавать программы на основе своей схемы. Поэтому делиться исходниками ядра не планирую.

Вот и у меня точно такой же подход. Сотрудничество должно быть взаимовыгодным. Объединение имеет смысл тогда когда от этого выигрывают обе стороны. Я сейчас только проиграю если начну метаться и браться за что-то новое не закончив то что уже начал. Так что для меня сейчас не выгодно с кем либо объединяться. Но вот когда я получу результаты - мне конечно станет выгодно обмениваться с кем либо этими результатами.
DK_sensey
Серьёзный посетитель
 
Сообщения: 133
Зарегистрирован: Пт июл 17, 2009 16:50:14
Откуда: Беларусь

Сообщение Tester » Пн ноя 02, 2009 4:44:07

Я занимаюсь этим 20 лет. Ничего особенного. И у меня так же есть свой софт на С++.
И я тоже не собираюсь его раздавать. А заслужил ты чего-там, или нет, этого никто не знает...
Просто многие вот так сидят на каких-то своих найденных изюминках и думают про дензнаки :(

В нашем мире по другому нельзя! Деньги - показатель таланта! "Если такой умный, то почему не богатый?" - преследует нас на каждом шагу. Что остается? Либо работаешь "на дядю", либо на себя! Если на дядю - ищи спонсора, предлагай ему свои идеи и получай зарплату. Если на себя - создай хоть что-нибудь, продай, заработай хоть немножко, создай фирму, найми команду и раскручивай свой продукт до конкурентно-способного. Первый проще, второй надежнее (если действительно есть талант).

Поэтому и мечтает каждый второй о том что сможет когда-нибудь раскрутить свой вариант компании с одним небольшим, но крайне выгодным продуктом, вроде Skype, TheBat, FineReader :?
Андрей
Аватара пользователя
Tester
Серьёзный посетитель
 
Сообщения: 101
Зарегистрирован: Пн янв 10, 2005 15:35:11
Откуда: Украина

Сообщение DK_sensey » Пн ноя 02, 2009 8:25:48

Что остается? Либо работаешь "на дядю", либо на себя!

Очень правильно сказано! Причем работать "на дядю" - заведомо тупиковый путь. Отдать свою жизнь за бесценок.

Какжется мы с вами единомышленники:)
DK_sensey
Серьёзный посетитель
 
Сообщения: 133
Зарегистрирован: Пт июл 17, 2009 16:50:14
Откуда: Беларусь

Сообщение Tester » Чт ноя 05, 2009 13:33:16

Кое-что наработал по теме... нарисовал звуковые спектры звука, снимаемые с микрофона! пока выглядит довольно странно, но уже есть чем похвастать! :) Куда можно выложить файл?

Добавлено спустя 7 часов 55 минут:

Прочитал ФАК по поводу выкладывания файлов... У меня НЕТ формы "Вставить вложение"!!! Хотя внизу пишет "Вы можете вкладывать файлы"!!! :evil:

Добавлено спустя 21 час 4 минуты 46 секунд:

Если я правильно понял, забрать файлик можно здесь: http://ai.obrazec.ru/forum/download.php?id=471
Андрей
Аватара пользователя
Tester
Серьёзный посетитель
 
Сообщения: 101
Зарегистрирован: Пн янв 10, 2005 15:35:11
Откуда: Украина

Сообщение DK_sensey » Чт ноя 05, 2009 20:52:55

Я попытался пройти по ссылке но мне выдало:

К сожалению вы не можете просматривать или скачивать это вложение

:(

Добавлено спустя 5 минут 10 секунд:

Кое-что наработал по теме... нарисовал звуковые спектры звука, снимаемые с микрофона!

Думаю у вас получилось не совсем то что надо. Дело в том что нужно различать звук одного тона с постоянной формой фолны и сложные звуки с динамическим тембром и переменной частотой. С микрофона мы получаем второй вариант. А формулы которые я дал предназначены для первого варианта.

Вообще звук одного тона с постоянным тембром (или формой волны) в природе найти сложно. Даже струна гитарыф дает колебания с динамически изменяющейся формой волны - и следовательно звук с динамически изменяющимся во времени тембром - что и придает звуку гитары его неповторимую красоту.

О том как работать с динамическими тембрами я знаю но это немного слодней. Я позже напишу, ОК?

Добавлено спустя 7 минут 1 секунду:

Вообще разложение в ряд Фурье предназначено для звуков постоянной частоты. С микрофона мы никогда реально не снимем таких звуков. С микрофона идет сумма большого количества частот, не обязательно кратных. Поэтому для получения спектра такого звука все же лучше вместо разложения в ряд Фурье использовать ряд резонансных фильтров. Это даст более адекватную картину по которой можно будет реально что-то распознавать. Резонансные фильтры сделать проще чем преобразование Фурье для сложных звуков.

Добавлено спустя 11 минут 50 секунд:

Фильтры лучше настроить на равномерно темперированный строй. Т.е. резонансная частота каждого следующего фильтра должна отличаться от частоты предыдущего в одно и то же число раз. При этом все фильтры должны покрыть диапазон от 20Гц до примерно 5000 Гц - в этом диапазоне находятся в основном все частоты по которым распознает звуки человек. Хотя конечно если вы хотите распознавать за пределами человеческого диапазона то это требование соблюдать необязательно:)


Если например разбивать звук на спектр из 10-ти частот то можно сделать фильтры настроенные на частоты:

20,37,68,126,233,430,794,1466,2707,5000 Гц
DK_sensey
Серьёзный посетитель
 
Сообщения: 133
Зарегистрирован: Пт июл 17, 2009 16:50:14
Откуда: Беларусь

Сообщение Василий » Чт ноя 05, 2009 23:19:24

Tester писал(а):
Прочитал ФАК по поводу выкладывания файлов... У меня НЕТ формы "Вставить вложение"!!! Хотя внизу пишет "Вы можете вкладывать файлы"!!! :evil:


Внизу можно на кнопку нажать "Вставить вложение", если нажимаете "Ответить", - а если пользуетесь быстрым ответом, то надо сначала зайти в "Предв. просмотр", перед Отправить, - там будет возможность вставить вложение.

Кстати, смените пожалуйста электронный адрес на работающий в Вашем профиле, - иначе почта Вам не приходит, а мне приходят сообщения об ошибке.

Добавлено спустя 56 секунд:

DK_sensey писал(а):Я попытался пройти по ссылке но мне выдало:

К сожалению вы не можете просматривать или скачивать это вложение

:(


Странно, только что проверил, - отдельных прав на скачивание нет на форуме, - Вам все разрешено...
Ищу лучшей жизни
Василий
Главный по тарелочкам
 
Сообщения: 1206
Зарегистрирован: Ср фев 07, 2007 12:22:27
Откуда: Санкт-Петербург

Пред.След.

Вернуться в Практический подход к искусственному интеллекту

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1


cron


Rambler's Top100 Каталог ресурсов ListTop.Ru Каталог сайтов Союз образовательных сайтов Parenting.ru - Родители семья дети ребенок

     Сайт "Искусственный интеллект" - программирование ИИ от разработчика: общение, статьи, ссылки.