HappyDev-lite-2016-весна 01 Денис Нелюбин. Вкалывать на роботовHappyDev-lite
Всё меняется. Всё меняется настолько быстро, что скоро мы перестанем успевать за изменениями. Роботы. Промышленные уже здесь. Бытовые появляются. Уже есть роботы-шахматисты и роботы-врачи. Скоро будут роботы-шоферы и роботы-слуги. Что дальше? Чем будут заниматься человеки?
Время поспекулировать, пофилософствовать и похоливарить. Пока есть время.
Introducing Compreno - Natural Language Processing TechnologyABBYY
ABBYY Compreno is a natural language processing technology that enables knowledge workers to extract insights and intelligence from unstructured text, transforming Dark Data into useful, actionable information.
Try Compreno for free https://www.abbyy.com/compreno/
HappyDev-lite-2016-весна 01 Денис Нелюбин. Вкалывать на роботовHappyDev-lite
Всё меняется. Всё меняется настолько быстро, что скоро мы перестанем успевать за изменениями. Роботы. Промышленные уже здесь. Бытовые появляются. Уже есть роботы-шахматисты и роботы-врачи. Скоро будут роботы-шоферы и роботы-слуги. Что дальше? Чем будут заниматься человеки?
Время поспекулировать, пофилософствовать и похоливарить. Пока есть время.
Introducing Compreno - Natural Language Processing TechnologyABBYY
ABBYY Compreno is a natural language processing technology that enables knowledge workers to extract insights and intelligence from unstructured text, transforming Dark Data into useful, actionable information.
Try Compreno for free https://www.abbyy.com/compreno/
The document discusses several optical illusions and visual phenomena, including text where rearranged letters can still be read, rotating shapes that appear stationary, hidden images within pictures, moving colored dots, and an instruction to stare at dots that claims looking away will reveal an apparition. It aims to confuse and trick the mind through unusual visual effects.
Rangkuman dokumen tersebut adalah sebagai berikut:
Dokumen tersebut membahas tentang pengertian bisnis dan perusahaan, pelaku bisnis seperti entrepreneur, stakeholders utama seperti pemilik, kreditur, karyawan, supplier dan pelanggan, fungsi-fungsi utama perusahaan seperti manajemen, pemasaran, akuntansi dan keuangan, langkah-langkah membuat rencana bisnis, dan komponen-komponen penting rencana bisnis seperti bagian
Tips to Grow your Business with Local SEOeZdia Inc
This document outlines best practices for local SEO, including conducting keyword research targeted to specific locations, optimizing website content with location-based keywords and H1/H2 tags, ensuring proper on-page optimization like local business listings, managing Google Maps listings and customer reviews on directories, and addressing challenges like initially lacking localized content and visibility in search engines. eZdia helps clients improve their local SEO through approaches like targeted city and neighborhood research and content creation to optimize pages and rankings.
The document discusses several optical illusions and visual phenomena, including text where rearranged letters can still be read, rotating shapes that appear stationary, hidden images within pictures, moving colored dots, and an instruction to stare at dots that claims looking away will reveal an apparition. It aims to confuse and trick the mind through unusual visual effects.
The document discusses the effect of austerity on economies. It defines austerity as economic policies aimed at reducing government budget deficits through lower spending and higher taxes. While austerity aims to restore confidence and improve fiscal positions, it often leads to falls in aggregate demand, higher unemployment, and lower economic growth. The document outlines some determinants that can impact the effects of austerity, such as labor market flexibility, spending policies, monetary policy, exchange rates, and global growth. It also discusses the negative impacts austerity can have through reduced demand, lower output and inflation, as well as some potential positive impacts on competitiveness. The summary concludes that higher taxes and lower spending from austerity may improve budget deficits in the short-run but could lead to lower economic growth
This document compares and contrasts four time machines - the Tardis, DeLorean, Time Turner, and Stewie's time machine - as potential options to help Santa deliver presents. The Tardis has many advantages like space and autonomous navigation but requires 6 operators. The DeLorean runs on trash but is slow and unreliable. The Time Turner is inconspicuous but tedious to use and can't carry presents. Stewie's machine is quick but fragile with no storage. The conclusion recommends combining features of each - the size and autonomy of the Tardis, fuel of the DeLorean, portability of the Time Turner, and accuracy of Stewie's machine.
10 tips, plus dozens of new tactics to create SEO-friendly content. Gain expert insights and real-life examples of how adjusting creative content process can boost your effectiveness. by Alok Jain #IRCE2014
This document contains random characters and symbols with no discernible meaning or context. It includes some numbers that could potentially represent data points on a pie chart but without any accompanying labels or explanation. The document overall does not convey any clear information that can be summarized.
How to Use Social Media to Influence the WorldMark Anav
This document discusses how social media can be used responsibly and effectively to influence the world in a positive way. It notes that while social media allows easy access to information and opinions, not all of those opinions are good. It recommends building authority on social media by posting inspiring, optimistic content that moves people positively and glorifies God. Specifically, the document suggests answering hard questions, sharing critical industry updates, and writing and distributing free reports in order to rise above opinions and gain people's attention for influencing the world for good.
Яндекс.Метрика и факторы для SEO-специалиста (Cybermarketing-2015). Севальнев...Дмитрий Севальнев
Подробней: http://www.pixelplus.ru/samostoyatelno/
Тезисы:
1. Распространение сервисов статистики от поисковых систем в рунете.
2. Сбор и анализ информации. Индексация.
3. Факторы, вероятно, используемые для ранжирования:
- поведение пользователей
- выявление аудитории проекта: срезы
- хостовые метрики
- технические показатели
4. Работа с данными счетчика для SEO-специалиста:
- настройка
- контрольные срезы и выгрузки
- вычисление KPI работ по SEO
- корректировки оптимизации сайта
5. Рекомендации и выводы.
Конференция Cybermarketing 2015: Яндекс.Метрика или как «большой брат» следит...Cybermarketing, Moscow
Распространение сервисов статистики от поисковых систем в рунете.
Сбор и анализ информации. Индексация.
Факторы, вероятно, используемые для ранжирования: поведение пользователей выявление аудитории проекта: срезы хостовые метрики технические показатели
Работа с данными счетчика для SEO-специалиста: настройка контрольные срезы и выгрузки вычисление KPI работ по SEO корректировки оптимизации сайта
Рекомендации и выводы.
Выбираем СУБД для хранения временных рядов / Павел Филонов (Лаборатория Каспе...Ontico
Проблема мониторинга целостности технологических процессов на индустриальных объектах связана с обработкой большого объема показаний различных датчиков (температура, давление, управляющие сигналы и т.д.). Каждый из таких сенсоров порождает временной ряд, который может быть использован как для потоковой обработки, так и для проведения исторического анализа и расследования инцидентов. Здесь возникает задача хранения показаний за некоторый период времени. При этом потоки данных могут достигать десятков тысяч показаний в секунду, а период хранения достигать нескольких месяцев или даже лет. При таких условиях необходимо предельно аккуратно выбирать СУБД для хранения временных рядов, которая правильно впишется в нефункциональные требования.
В качестве конкурсантов выступят: OpenTSDB, InfluxDB, MongoDB, PostgreSQL и еще несколько "чёрных лошадок".
В докладе будет рассмотрен многокритериальный подход к выбору с учетом таких показателей как:
* зависимость пропускной способности на запись от различных параметров;
* время исполнения запроса на чтение;
* степень сжатия данных;
* пропускная способность при нагрузочном тестировании.
В докладе предлагается не только привести получившиеся числа, но и обсудить почему они получились именно такими.
The document discusses several optical illusions and visual phenomena, including text where rearranged letters can still be read, rotating shapes that appear stationary, hidden images within pictures, moving colored dots, and an instruction to stare at dots that claims looking away will reveal an apparition. It aims to confuse and trick the mind through unusual visual effects.
Rangkuman dokumen tersebut adalah sebagai berikut:
Dokumen tersebut membahas tentang pengertian bisnis dan perusahaan, pelaku bisnis seperti entrepreneur, stakeholders utama seperti pemilik, kreditur, karyawan, supplier dan pelanggan, fungsi-fungsi utama perusahaan seperti manajemen, pemasaran, akuntansi dan keuangan, langkah-langkah membuat rencana bisnis, dan komponen-komponen penting rencana bisnis seperti bagian
Tips to Grow your Business with Local SEOeZdia Inc
This document outlines best practices for local SEO, including conducting keyword research targeted to specific locations, optimizing website content with location-based keywords and H1/H2 tags, ensuring proper on-page optimization like local business listings, managing Google Maps listings and customer reviews on directories, and addressing challenges like initially lacking localized content and visibility in search engines. eZdia helps clients improve their local SEO through approaches like targeted city and neighborhood research and content creation to optimize pages and rankings.
The document discusses several optical illusions and visual phenomena, including text where rearranged letters can still be read, rotating shapes that appear stationary, hidden images within pictures, moving colored dots, and an instruction to stare at dots that claims looking away will reveal an apparition. It aims to confuse and trick the mind through unusual visual effects.
The document discusses the effect of austerity on economies. It defines austerity as economic policies aimed at reducing government budget deficits through lower spending and higher taxes. While austerity aims to restore confidence and improve fiscal positions, it often leads to falls in aggregate demand, higher unemployment, and lower economic growth. The document outlines some determinants that can impact the effects of austerity, such as labor market flexibility, spending policies, monetary policy, exchange rates, and global growth. It also discusses the negative impacts austerity can have through reduced demand, lower output and inflation, as well as some potential positive impacts on competitiveness. The summary concludes that higher taxes and lower spending from austerity may improve budget deficits in the short-run but could lead to lower economic growth
This document compares and contrasts four time machines - the Tardis, DeLorean, Time Turner, and Stewie's time machine - as potential options to help Santa deliver presents. The Tardis has many advantages like space and autonomous navigation but requires 6 operators. The DeLorean runs on trash but is slow and unreliable. The Time Turner is inconspicuous but tedious to use and can't carry presents. Stewie's machine is quick but fragile with no storage. The conclusion recommends combining features of each - the size and autonomy of the Tardis, fuel of the DeLorean, portability of the Time Turner, and accuracy of Stewie's machine.
10 tips, plus dozens of new tactics to create SEO-friendly content. Gain expert insights and real-life examples of how adjusting creative content process can boost your effectiveness. by Alok Jain #IRCE2014
This document contains random characters and symbols with no discernible meaning or context. It includes some numbers that could potentially represent data points on a pie chart but without any accompanying labels or explanation. The document overall does not convey any clear information that can be summarized.
How to Use Social Media to Influence the WorldMark Anav
This document discusses how social media can be used responsibly and effectively to influence the world in a positive way. It notes that while social media allows easy access to information and opinions, not all of those opinions are good. It recommends building authority on social media by posting inspiring, optimistic content that moves people positively and glorifies God. Specifically, the document suggests answering hard questions, sharing critical industry updates, and writing and distributing free reports in order to rise above opinions and gain people's attention for influencing the world for good.
Яндекс.Метрика и факторы для SEO-специалиста (Cybermarketing-2015). Севальнев...Дмитрий Севальнев
Подробней: http://www.pixelplus.ru/samostoyatelno/
Тезисы:
1. Распространение сервисов статистики от поисковых систем в рунете.
2. Сбор и анализ информации. Индексация.
3. Факторы, вероятно, используемые для ранжирования:
- поведение пользователей
- выявление аудитории проекта: срезы
- хостовые метрики
- технические показатели
4. Работа с данными счетчика для SEO-специалиста:
- настройка
- контрольные срезы и выгрузки
- вычисление KPI работ по SEO
- корректировки оптимизации сайта
5. Рекомендации и выводы.
Конференция Cybermarketing 2015: Яндекс.Метрика или как «большой брат» следит...Cybermarketing, Moscow
Распространение сервисов статистики от поисковых систем в рунете.
Сбор и анализ информации. Индексация.
Факторы, вероятно, используемые для ранжирования: поведение пользователей выявление аудитории проекта: срезы хостовые метрики технические показатели
Работа с данными счетчика для SEO-специалиста: настройка контрольные срезы и выгрузки вычисление KPI работ по SEO корректировки оптимизации сайта
Рекомендации и выводы.
Выбираем СУБД для хранения временных рядов / Павел Филонов (Лаборатория Каспе...Ontico
Проблема мониторинга целостности технологических процессов на индустриальных объектах связана с обработкой большого объема показаний различных датчиков (температура, давление, управляющие сигналы и т.д.). Каждый из таких сенсоров порождает временной ряд, который может быть использован как для потоковой обработки, так и для проведения исторического анализа и расследования инцидентов. Здесь возникает задача хранения показаний за некоторый период времени. При этом потоки данных могут достигать десятков тысяч показаний в секунду, а период хранения достигать нескольких месяцев или даже лет. При таких условиях необходимо предельно аккуратно выбирать СУБД для хранения временных рядов, которая правильно впишется в нефункциональные требования.
В качестве конкурсантов выступят: OpenTSDB, InfluxDB, MongoDB, PostgreSQL и еще несколько "чёрных лошадок".
В докладе будет рассмотрен многокритериальный подход к выбору с учетом таких показателей как:
* зависимость пропускной способности на запись от различных параметров;
* время исполнения запроса на чтение;
* степень сжатия данных;
* пропускная способность при нагрузочном тестировании.
В докладе предлагается не только привести получившиеся числа, но и обсудить почему они получились именно такими.
Оптимизация процесса тестирования с использованием аналитических подходов RCA...Aleksandr Meshkov
Достаточно часто многие организации проводят аудиты или оценки зрелости своего процесса тестирования с целью повышения его эффективности. Такие модели, как TMMI, TPI Next и другие, позволяют оптимизировать процесс тестирования, но насколько эффективно будет ваше решение, основанное на общих практиках? Поможет ли оно именно вашему процессу тестирования?
Многие сталкивались с проблемами того, что мировые практики не всегда подходят для решения именно ваших проблем в процессе тестирования. Поэтому, я расскажу вам об абсолютно другом подходе к оптимизации процесса тестирования, основанного на аналитических моделях RCA и GQM, которые на самом низком уровне определяют причины ваших проблем, что позволяет "точечно" решать конкретные задачи, тем самым повышая эффективность принимаемых вами решений для совершенствования процесса тестирования.
Роман Акинфеев «Разработка RESTful API with all bells and whistles»DevDay
Каждый уважающий себя интернет-сервис, ориентированный больше чем на одну платформу, сегодня имеет RESTful API. Но мало кто понимает что такое REST, с чем его едят, как готовят и чем он полезен для здоровья. Кто-то считает, что RESTful API - это API использующее в качестве транспорта протокол HTTP, кто-то думает, что REST - это стандарт в рамках которого разработчики ограничены набором ресурсов и восьмью операциями над ними. Я расскажу о том как мы в Яндекс.Диске понимаем REST, как его готовим и какую пользу он нам приносит.
Юлия Викторова; Александр Тарасов. DevOps без булшита.ScrumTrek
В своём докладе мы расскажем о том, что значит DevOps для нас, и как мы его готовим в большой организации со всеми её ограничениями, проблемами и челленджами как с технической, так и менеджерской точек зрения. Поделимся наработанным уникальным опытом в непростых вопросах: а зачем банку вообще нужен DevOps? как поставить более-менее правильные цели и продать это себе, своим коллегам, начальнику и бизнесу? Какие метрики нужно поставить, и попробуем разобраться есть ли в метриках счастье? Покажем, какие метрики были для нас окошком в Нарнию, и что в итоге получилось, расскажем про трансформацию людей и те инженерные практики, которые мы применяем (парная работа, тотальный кодинг, TDD, Infrastructure as a Code, API самообслуживания и т.д.), ответим на вопросы о том, что это за команда DevOps: какие грабли точно подстерегают нас, и как не наступать на них
2. План выступления
● Обзор технологии ABBYY InfoExtractor
● Задача извлечения информации с высокой точностью
● Технология компании ABBYY
● Результаты
● Вопросы
2
3. Обзор технологии ABBYY InfoExtractor
● Извлекаем информацию из текста и представляем ее
в виде RDF-графа
3
«Виолончелист Мстислав Ростропович родился в Баку в 1927 году»
Person
Мстислав Ростропович Баку
Виолончелист
where
label
PointOfTime
BirthOccupation
1927
year
Location
5. Иерархия семантических классов
5
ENTITY
PHYSICAL
OBJECT
BEING
HUMAN
MAN AS
PROFESSIONAL
WORKER
PROFESSIONAL IN
ENGINEERING
ENGINEER
Инженер
PROGRAMMER
Программист
PROFESSIONAL
IN MUSIC
GUITARIST
Гитарист
VIOLINIST
Скрипач
VIOLONCELLO
PLAYER
Виолончелист
PROFESSIONAL IN
EDUCATION
PROFESSIONAL IN
MEDICINE
ANIMAL
ORGANISATION
6. Шаблоны для деревьев семантико-
синтаксических разборов
6
Программист Иван Федоров
Программист российской компании ABBYY Иван Федоров
Самый известный виолончелист России Мстислав Ростропович
Виолончелист Мстислав Ростропович родился в Баку в 1927 году
this "MAN AS PROFESSIONAL WORKER"
Classifier_Name: child
Шаблон для извлечения профессии:
7. Правила извлечения информации
7
Пример правила, создающего факт Occupation и заполняющего его
атрибуты:
this "MAN_AS_PROFESSIONAL_WORKER" [
ClassifierName: child <% Person %>
]
=>
Occupation fact(this.core),
fact.position == Norm(this.core),
fact.employee == child.o,
annotation(fact, this.core);
«Виолончелист Мстислав Ростропович родился в Баку в 1927 году»
8. Сильные стороны подхода с использованием
продукционных правил и семантико-
синтаксических разборов
8
● Устойчивость к смене корпуса
● Гибкость языка правил извлечения информации
● Возможность моделировать сложные сущности, атрибуты и факты
● Поддержка конструкций для извлечения информации из таблиц
● Возможность написания универсальных правил для нескольких
языков
● Использование возможностей языковой модели ABBYY Compreno
9. Бизнес сценарии и постановка
задачи
● Бизнес-сценарии
● Анализ заявлений о выплате страховых компенсаций
● Анализ платежных поручений
● Ввод данных в системы электронного документооборота (СЭД)
● Требуется ручная верификация извлеченной информации
● Задача: повысить эффективность ввода данных, сократив
трудозатраты
9
10. Решение задачи
● Предоставить пользователю степень уверенности
извлечения информации
● «Лучший виолончелист мира Мстислав Ростропович»
● Person
– firstname = Мстислав
– surname = Ростропович
● Occupation
– position = виолончелист мира
– employee = Мстислав Ростропович
10
Степень уверенности
0.97
0.94
0.02
0.92
11. Процесс оценки уверенности и
верификации извлеченной информации
11
Извлеченный RDF-граф
RDF-граф с оцененной
уверенностью
Оценка уверенности
Эталонная
разметка
Автоматическая
разметка
Верифицированный
RDF-граф
Документ
Извлечение информации
Верификация
Обучение
Механизм оценки
уверенности
Пользователь
12. ● Пример графика для подбора порога степени уверенности в
зависимости от необходимой точности извлечения
● Например:
● Для получения точности 0.94 необходимо установить порог 0.15
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0.82 0.84 0.86 0.88 0.9 0.92 0.94 0.96 0.98 1
Порогстепениуверенности
Точность
Подбор порога степени уверенности
12
13. Определение соотношения между
точностью и трудозатратами
● Пример графика зависимости доли верифицируемых
свойств от точности, достигаемой после верификации
● График позволяет найти компромисс между точностью и
объемом трудозатрат на верификацию
13
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0.8 0.82 0.84 0.86 0.88 0.9 0.92 0.94 0.96 0.98 1
Доляверифицируемыхатрибутов
Точность
14. Обучение механизма оценки степени
уверенности
14
«Лучший виолончелист мира Мстислав Ростропович»
Эталонная разметка
Автоматическая
разметка
firstname =
“Мстислав”
firstname =
“Мстислав”
surname =
“Ростропович”
surname =
“Ростропович”
position =
“виолончелист”
position =
“виолончелист мира”
employee =
“Мстислав
Ростропович”
employee =
“Мстислав
Ростропович”
… …
15. Обучение механизма оценки степени
уверенности
15
«Лучший виолончелист мира Мстислав Ростропович»
Эталонная разметка
Автоматическая
разметка Is Correct
firstname =
“Мстислав”
firstname =
“Мстислав”
True
surname =
“Ростропович”
surname =
“Ростропович”
True
position =
“виолончелист”
position =
“виолончелист мира”
False
employee =
“Мстислав
Ростропович”
employee =
“Мстислав
Ростропович”
True
… … …
16. Обучение механизма оценки степени
уверенности
16
«Лучший виолончелист мира Мстислав Ростропович»
Эталонная разметка
Автоматическая
разметка Is Correct
Решение
классификатора P(Correct)
firstname =
“Мстислав”
firstname =
“Мстислав”
True True 0.97
surname =
“Ростропович”
surname =
“Ростропович”
True True 0.94
position =
“виолончелист”
position =
“виолончелист мира”
False False 0.02
employee =
“Мстислав
Ростропович”
employee =
“Мстислав
Ростропович”
True True 0.92
… … … … …
17. ● Характеристики составляющих, на которых сработало
правило: семантические классы, поверхностные и
глубинные позиции, грамматические, морфологические
признаки т.п.
● Характеристики текста: длина предложений, успешность
разбора и т.п.
● Цепочка сработавших правил
Признаки для классификатора
17
create_firstname
create_surname
create_occupation_fact
create_person
add_employee
18. Процесс оценки уверенности и
верификации извлеченной информации
18
Извлеченный RDF-граф
RDF-граф с оцененной
уверенностью
Оценка уверенности
Эталонная
разметка
Автоматическая
разметка
Верифицированный
RDF-граф
Документ
Извлечение информации
Верификация
Обучение
Механизм оценки
уверенности
Пользователь
19. Дообучение механизма оценки
уверенности извлеченной информации
19
Извлеченный RDF-граф
RDF-граф с оцененной
уверенностью
Оценка уверенности
Эталонная
разметка
Автоматическая
разметка
Верифицированный
RDF-граф
Документ
Извлечение информации
Верификация
Обучение
Механизм оценки
уверенности
Верифицированные атрибуты
Извлеченные атрибуты
Пользователь
20. Преимущества дообучения степени
уверенности на стороне клиента
● Обучающая выборка существенно расширяется за счет
атрибутов из верифицированных RDF-графов
● Качество оценки уверенности увеличивается в процессе
эксплуатации системы
● Уменьшается количество атрибутов, требующих
верификации пользователем
● Данные находятся на стороне клиента, что гарантирует
сохранение конфиденциальной информации
20
21. Результаты
● Приведены результаты оценки уверенности на корпусе
● 1000 документов от заказчика
● Размечен классами: персоны, организации, локации, род деятельности,
местоположение, купля-продажа
● Около 200 000 атрибутов
21
Доля
верифицированных
свойств
Точность
извлечения
атрибутов
Без верификации 0.83
10% 0.89
30% 0.96
60% 0.99 0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0.8 0.82 0.84 0.86 0.88 0.9 0.92 0.94 0.96 0.98 1
Доляверифицируемыхсвойств
Точность
23. Дополнительная информация
● Система извлечения информации ABBYY Compreno
1. Anisimovich K.V., Druzhkin K. Ju., Minlos F.R., Petrova M.A., Selegey V.P.,
Zuev K.A. Syntactic and semantic parser based on ABBYY Compreno
linguistics technologies // Proceedings of the International Conference
“Dialog”, Bekasovo, 2012
2. Starostin A. S., Smurov I.M., Stepanova M.E. A production system for
information extraction based on complete syntactic-semantic analysis //
Proceedings of the International Conference “Dialog”, Bekasovo, 2014
● Корпоративный блог ABBYY на Хабрахабре
● http://habrahabr.ru/company/abbyy/
23
24. КОНТАКТЫ
ABBYY Headquarters
Тел.: +7 (495) 783 3700
Факс: +7 (495) 783 2663
Адрес: Москва, ст. м. Отрадное, ул. Отрадная, 2Б,
строение 6, бизнес-центр «Отрадный»
E-mail: office@abbyy.com
Web: www.abbyy.com