Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Использование Гамма распределения при решении задачи классификации. Свердлов Евгений
Задача: Классификация  элементов области ( 2-class). Пример: Написан ли текст подписавшимся ?  Элемент – (Текст1, Текст2)....
Есть несколько характеристик текста. Использование одной недостаточно. Как использовать все?
“ Naive Bayes Classifer ”  ? ф-ии плотности для каждой гипотезы ?  Н1 : (Автор 1 = Автор2)  Н2 : (Автор 1 ≠  Автор2)  Плот...
 
Выяснение авторства по текстам: 1. Распределение биграмм букв  ( сравнение вероятностей наиболее частотных ) :    EER  ≤ 0...
 
 
2. Распределение биграмм категорий слов (частей речи) (сравнение вероятностей наиболее частотных):  EER ≤ 0.25 (0.95). Сов...
 
 
<ul><li>Требования: </li></ul><ul><li>Нормальность характеристик. </li></ul><ul><li>«Хорошая» оценка дисперсий. </li></ul>
<ul><li>Далее: </li></ul><ul><li>Применить для  n-class  задач. </li></ul><ul><li>Использовать информацию из предметных об...
Upcoming SlideShare
Loading in …5
×

Использование Гамма распределения при решении задачи классификации

1,550 views

Published on

Евгений Свердлов
"Использование Гамма распределения при решении задачи классификации"

  • Be the first to comment

  • Be the first to like this

Использование Гамма распределения при решении задачи классификации

  1. 1. Использование Гамма распределения при решении задачи классификации. Свердлов Евгений
  2. 2. Задача: Классификация элементов области ( 2-class). Пример: Написан ли текст подписавшимся ? Элемент – (Текст1, Текст2). Автор1 = Автор2 ? (Есть база авторских текстов).
  3. 3. Есть несколько характеристик текста. Использование одной недостаточно. Как использовать все?
  4. 4. “ Naive Bayes Classifer ” ? ф-ии плотности для каждой гипотезы ? Н1 : (Автор 1 = Автор2) Н2 : (Автор 1 ≠ Автор2) Плотности “ Гамма-образны ” :
  5. 6. Выяснение авторства по текстам: 1. Распределение биграмм букв ( сравнение вероятностей наиболее частотных ) : EER ≤ 0.28 (0.95).
  6. 9. 2. Распределение биграмм категорий слов (частей речи) (сравнение вероятностей наиболее частотных): EER ≤ 0.25 (0.95). Совмещение: EER ≤ 0.23 (0.95).
  7. 12. <ul><li>Требования: </li></ul><ul><li>Нормальность характеристик. </li></ul><ul><li>«Хорошая» оценка дисперсий. </li></ul>
  8. 13. <ul><li>Далее: </li></ul><ul><li>Применить для n-class задач. </li></ul><ul><li>Использовать информацию из предметных областей, чтобы улучшить результат. </li></ul>

×