Патенты автора ЛЮ Хуайцзюнь (CN)

Изобретение относится к методам обработки информации. Техническим результатом является повышение точности определения важности слов в классифицированных данных большого объема. В предлагаемом способе вычисляют Документную Частоту (ДЧ) слова в классифицированных данных. Затем выполняют одноаспектные оценки слова согласно ДЧ. После чего выполняют многоаспектную оценку слова по результатам одноаспектных оценок для получения весового коэффициента важности слова. Причем перед вычислением ДЧ в классифицированных данных предварительно выполняют обработку указанного слова и (или) после получения коэффициента важности определяют значимость слова согласно его коэффициенту важности. При определении значимости слова по его коэффициенту важности задают пороговое значение важности и пороговое значение постоянного использования для каждого уровня. Определяют значимость слова на уровне согласно отношению между двумя пороговыми значениями и коэффициентом важности. Выполняют нормализацию коэффициента важности на каждом уровне для получения комплексного весового коэффициента. На основе комплексного коэффициента выполняют комплексную классификацию значимости для слов одинаковой значимости на разных уровнях. 4 н. и 20 з.п. ф-лы, 5 ил.

 


Наверх