[userpic]

... 

klizardin в посте Metapractice (оригинал в ЖЖ)

метод работает следующим образом:
1. строим обучающий корпус. это фразы размеченные по категориям.
категории формируем в виде списка ("А", "Б", "В", ...)
далее
всем/части словам приписывается категория
всем/части группам слов приписывается категория
получаем фразу в следующем виде:
"мама"(категория 1) + "мыла"(категория 2)
              \ /
                 * (категория 3) + "раму" (категория 1)
                                      \ /
                                    * (категория 4)

т.е. по результату получаем некоторое дерево фразы с присвоенными категориями.
(можно эксперементировать и смотреть, что будет если, только малому числу слов задавать категорию. были примеры за то, что и классифиация малой части должна работать, но ясно будет только по результатам экспериментов)
2. провести обучение приложения на обучающем корпусе.
3. предъявляем фразу
далее приложение ищет наиболее возможное разбиение (для формирования дерева) и определяет категории на каждой из вершин полученного разбиения. также разбиение можно будет задавать.

1 комментарий