16. 16
В угоду китайской классической цивилизации случай Новоиспеченного Года появляется важнейшим обращением в свойскою жизнедеятельности. В согласьи с общепринятым в поднебесной месячным альманахом оно совпадает с первым утром цокольного спутника, сиречь, по григорианскому летосчислению, с середкой февраля. В текущем году это ночь с 11 на 12 февраля.
По воззрению китайцев в сей 1-ый вешний денек происходит просыпание черты, наступает исчисление новейшего годичного ряда, воскресают почва и сберегаемые ей же всходы жизнедеятельности. Сей видный праздничек весок не совсем только в угоду ханьцев, да и в угоду альтернативных государственных меньшинств. Его выделяют маньчжуры, монголы, яотяне, чжуаны, гаошаньцы, дауры, дунцы, лияне и те этнические общества.
17. Примеры синонимайзинга
17
Синонимайзинг
А на самом деле
тем не ниже
тем не менее
которое-то
какое-то
предельно иной
совсем другой
теперешний день
сегодняшний день
слишком первым
самым первым
являет из себя
представляет собой
как не возбраняется лучше
как нельзя лучше
без малого неизменно
почти всегда
сердитая система
нервная система
средней цитадели
средней крепости
на неженатых оборотах
на холостых оборотах
товарищ от друга
друг от друга
таким ликом
таким образом
биологически бодрые добавки
биологически активные добавки
новоиспеченный сезон
Новый Год
грядущего содержания
следующего содержания
22. Если хочется подробнее
Неестественные тексты в интернете
22
Про различные способы формирования неестественных текстов можно почитать в статьях:
http://rcdl.ru/doc/2011/paper27.pdf
http://www.cir.ru/docs/ips/publications/2009_rcdl_markov.pdf
или в презентации:
http://www.myshared.ru/slide/232007/
23. На что смотреть
Неестественные тексты в интернете
23
▌Признаки, связанные с читабельностью текста;
▌Стилистические особенности текста;
▌Глобальные статистические характеристики;
▌Статистика употребления знаков препинания.
▌… Etc.
24. Факторы
Неестественные тексты в интернете
24
▌Среднее количество слов в предложениях;
▌Среднее количество слов, начинающихся с заглавной буквы;
▌Среднее количество знаков пунктуации на предложение;
▌Среднее количество знаков экспрессивной пунктуации («!», «?», «...»);
▌… Etc.
25. Факторы
Неестественные тексты в интернете
25
Доля различных частей речи:
▌Доля глаголов среди слов;
▌Доля прилагательных среди слов;
▌Доля существительных среди слов;
▌Доля числительных среди слов;
▌Доля порядковых числительных
▌среди слов;
▌Доля наречий среди слов;
▌Доля частиц среди слов;
▌Доля предлогов среди слов;
▌Доля частиц среди слов;
▌Доля междометий среди слов;
+ Дисперсии количества различных частей речи по предложениям
26. Факторы
Неестественные тексты в интернете
26
▌Доля местоимений первого лица;
▌Доля местоимений второго лица;
▌Количество частиц «бы»;
▌Количество частиц «ну», «вот», «ведь»;
▌… Etc.
Доля глаголов по временам:
▌Доля глаголов настоящего времени;
▌… Etc.
Доля существительных по родам:
▌Доля существительных мужского рода среди слов и среди существительных
▌… Etc.
28. Факторы
Неестественные тексты в интернете
28
•Повторы слов
•Нетипичные последовательности слов (как посчитать?)
•Использование редких слов
•Etc.
•Etc.
•Etc.