... ↑

klizardin 26 сентября 2014, 13:35 в посте Metapractice (оригинал в ЖЖ)

метод работает следующим образом:

1. строим обучающий корпус. это фразы размеченные по категориям.

категории формируем в виде списка ("А", "Б", "В", ...)

всем/части словам приписывается категория

всем/части группам слов приписывается категория

получаем фразу в следующем виде:

"мама"(категория 1) + "мыла"(категория 2)
              \ /
                 * (категория 3) + "раму" (категория 1)
                                      \ /
                                    * (категория 4)

т.е. по результату получаем некоторое дерево фразы с присвоенными категориями.

(можно эксперементировать и смотреть, что будет если, только малому числу слов задавать категорию. были примеры за то, что и классифиация малой части должна работать, но ясно будет только по результатам экспериментов)

2. провести обучение приложения на обучающем корпусе.

3. предъявляем фразу

далее приложение ищет наиболее возможное разбиение (для формирования дерева) и определяет категории на каждой из вершин полученного разбиения. также разбиение можно будет задавать.

1 комментарий

</>

Пробуем привести в соответствие

metanymous 26 сентября 2014, 14:33 (оригинал в ЖЖ)

Хм.

В языкоиде мы различаем:

(а) лингвистические (лексические и грамматические или же паралингвистические) "сигналы". Типичное число сигналов в конкретном языкоиде равно 2. В другом крайнем случае число сигналов около 10.

(б) собственно конкретные "семантики" языкоида в ограниченном числе, типично равном 2 "семантикам". Ну, и "семантик" может быть до 10 штук.

Получается, для установления/обучения нейросети на языкоид мы должны указать:

--список и признаки языкоидных сигналов. Как они будут сделаны размеченными в виде категорий?

--список и обучающие примеры семантик. Эти, вроде, маркируются категориями как указал ты

Так?