JetOctopus.com Serge Bezborodov
Text Emeddings
магія AI
як працює під капотом
JetOctopus.com Serge Bezborodov
Хто я
- СТО, JetOctopus, 14 років досвіду
- 5 років роботи над агрегаторами
- був змушений заглибитись в SEO
- job
- недвіжка
- авто
- товари
- с 2016 року - краулер JetOctopus.com
- SEO карма - перша офісна
праця в miralinks
JetOctopus.com Serge Bezborodov
Як компʼютери розуміють текста?
JetOctopus.com Serge Bezborodov
Як компʼютери розуміють текста?
кіт котик
JetOctopus.com Serge Bezborodov
Як компʼютери розуміють текста?
кіт котик
d0 ba d1 96 d1 82 d0 ba d0 be d1 82 d0 b8 d0 ba
JetOctopus.com Serge Bezborodov
Як компʼютери розуміють текста?
кіт котик
d0 ba d1 96 d1 82 d0 ba d0 be d1 82 d0 b8 d0 ba
миша
d0 bc d0 b8 d1 88 d0 b0
JetOctopus.com Serge Bezborodov
Як компʼютери розуміють текста?
кіт котик
d0 ba d1 96 d1 82 d0 ba d0 be d1 82 d0 b8 d0 ba
миша
d0 bc d0 b8 d1 88 d0 b0
міша
d0 bc d1 96 d1 88 d0 b0
JetOctopus.com Serge Bezborodov
Як компʼютери розуміють текста?
кіт котик
d0 ba d1 96 d1 82 d0 ba d0 be d1 82 d0 b8 d0 ba
миша
d0 bc d0 b8 d1 88 d0 b0
міша
d0 bc d1 96 d1 88 d0 b0
JetOctopus.com Serge Bezborodov
Декартова система координат
x
y
Cartesian coordinate system
JetOctopus.com Serge Bezborodov
Вектор
x
y
JetOctopus.com Serge Bezborodov
Слова = вектори?
x
y
кіт
котик
миша
міша
JetOctopus.com Serge Bezborodov
Слова = вектори?
Схожість слів = Дистація між векторами
JetOctopus.com Serge Bezborodov
Слова = вектори?
Схожість контенту = Дистація між векторами
JetOctopus.com Serge Bezborodov
Cosine similarity
JetOctopus.com Serge Bezborodov
Cosine similarity
x
y
кіт
міша
similarity
JetOctopus.com Serge Bezborodov
Euclidean distance
x
y
кіт
миша
euclidean distance (similarity)
JetOctopus.com Serge Bezborodov
Cosine similarity vs Euclidean distance
JetOctopus.com Serge Bezborodov
Vector space
Vector space is multidimensional
JetOctopus.com Serge Bezborodov
Як AI проставляє вектори?
в процессі навчання на великих обʼємах текстів
JetOctopus.com Serge Bezborodov
Як AI проставляє вектори?
чим ближче слова знаходяться в текстах,
тим вони більш повʼязані по сенсу
тим ближче будуть іх вектори
JetOctopus.com Serge Bezborodov
“- дуже дякую,
але нащо воно мені треба?”
скажіть де взяти лінок?
JetOctopus.com Serge Bezborodov
Text Embeddings - практичне застосування
1. схожість контенту
2. кластерізація контенту
3. рекомендаційні системи
4. виявлення аномалій
5. переклади
і купа іншого
JetOctopus.com Serge Bezborodov
Text Embeddings - практичне застосування
1. схожість контенту
2. кластерізація контенту
3. рекомендаційні системи
4. виявлення аномалій
5. переклади
і купа іншого
семантична перелінковка
підгонка сторінок під кейворди
редиректи
семантичний лінкбілдінг?
JetOctopus.com Serge Bezborodov
Text Embeddings - як почати, що треба?
1. программіст
2. API:
- Open AI
- Google Vertex
- Llama
3. дуже багато терпіння
JetOctopus.com Serge Bezborodov
Text Embeddings - як почати, що треба?
1. беремо контент сайту - база або краул
2. розраховуємо text embeddings по кожній сторінці
3. зберігаємо в базу (бажано котра підтримує векторні функціі)
JetOctopus.com Serge Bezborodov
Text Embeddings - redirects
З видаленних сторінок робимо редиректи на сторінки,
котрі найбільш близьки по розрахунку дистанціі між векторами
JetOctopus.com Serge Bezborodov
Text Embeddings - підгонка сторінок під кейворди
1. Беремо кейворди та URL із GSC по котрим ранжуються
2. Розраховуємо embeddings по кейвордах
3. Аналізуємо наскільки вектор кейворда відноситься до вектору сторінок,
що обрав гугл
4. Аналізуємо який контент є сторінках, що ближче по дистанціі,
а ніж обрав гугл
JetOctopus.com Serge Bezborodov
Text Embeddings - перелінковка
Ставимо лінки із сторінок на найбільш близькі сторінки по дистаціі.
спрощено:
JetOctopus.com Serge Bezborodov
Text Embeddings - перелінковка
Ставимо лінки із сторінок на найбільш близькі сторінки по дистаціі.
спрощено:
в реале:
1. робимо повний краул із всієй перелінковкою
2. грузимо логи за 3-6 місяців
3. грузимо дані із GSC в розрізі по сторінках
4. аналізуємо сторінки на котрі треба покращувати перелінковку:
- не крауляться ботом
- треба підняти позиціі по НЧ хвосту
5. беремо якісні сторінки (крауляться ботом, є трафік)
6. проставляємо з них лінки на underpeform сторінки
7. аналізуємо результат, файтюнимо
JetOctopus.com Serge Bezborodov
Text Embeddings - перелінковка
Ставимо лінки із сторінок на найбільш близькі сторінки по дистаціі.
спрощено:
в реале:
1. робимо повний краул із всієй перелінковкою
2. грузимо логи за 3-6 місяців
3. грузимо дані із GSC в розрізі по сторінках
4. аналізуємо сторінки на котрі треба покращувати перелінковку:
- не крауляться ботом
- треба підняти позиціі по НЧ хвосту
5. беремо якісні сторінки (крауляться ботом, є трафік)
6. проставляємо з них лінки на underpeform сторінки
7. аналізуємо результат, файтюнимо
JO
Inter
Linker
JetOctopus.com Serge Bezborodov
Text Embeddings - лінкбілдінг
Наскільки контент ваших донорів
співпадає із контентом ваших сторінок?
JetOctopus.com Serge Bezborodov
AI - це не магія
JetOctopus.com Serge Bezborodov
Дякую
https://x.com/sergebezborodov
питання?

Text Embeddings: як працює під капотом магія AI | Сергій Безбородов

  • 1.
    JetOctopus.com Serge Bezborodov TextEmeddings магія AI як працює під капотом
  • 2.
    JetOctopus.com Serge Bezborodov Хтоя - СТО, JetOctopus, 14 років досвіду - 5 років роботи над агрегаторами - був змушений заглибитись в SEO - job - недвіжка - авто - товари - с 2016 року - краулер JetOctopus.com - SEO карма - перша офісна праця в miralinks
  • 3.
    JetOctopus.com Serge Bezborodov Яккомпʼютери розуміють текста?
  • 4.
    JetOctopus.com Serge Bezborodov Яккомпʼютери розуміють текста? кіт котик
  • 5.
    JetOctopus.com Serge Bezborodov Яккомпʼютери розуміють текста? кіт котик d0 ba d1 96 d1 82 d0 ba d0 be d1 82 d0 b8 d0 ba
  • 6.
    JetOctopus.com Serge Bezborodov Яккомпʼютери розуміють текста? кіт котик d0 ba d1 96 d1 82 d0 ba d0 be d1 82 d0 b8 d0 ba миша d0 bc d0 b8 d1 88 d0 b0
  • 7.
    JetOctopus.com Serge Bezborodov Яккомпʼютери розуміють текста? кіт котик d0 ba d1 96 d1 82 d0 ba d0 be d1 82 d0 b8 d0 ba миша d0 bc d0 b8 d1 88 d0 b0 міша d0 bc d1 96 d1 88 d0 b0
  • 8.
    JetOctopus.com Serge Bezborodov Яккомпʼютери розуміють текста? кіт котик d0 ba d1 96 d1 82 d0 ba d0 be d1 82 d0 b8 d0 ba миша d0 bc d0 b8 d1 88 d0 b0 міша d0 bc d1 96 d1 88 d0 b0
  • 9.
    JetOctopus.com Serge Bezborodov Декартовасистема координат x y Cartesian coordinate system
  • 10.
  • 11.
    JetOctopus.com Serge Bezborodov Слова= вектори? x y кіт котик миша міша
  • 12.
    JetOctopus.com Serge Bezborodov Слова= вектори? Схожість слів = Дистація між векторами
  • 13.
    JetOctopus.com Serge Bezborodov Слова= вектори? Схожість контенту = Дистація між векторами
  • 14.
  • 15.
    JetOctopus.com Serge Bezborodov Cosinesimilarity x y кіт міша similarity
  • 16.
    JetOctopus.com Serge Bezborodov Euclideandistance x y кіт миша euclidean distance (similarity)
  • 17.
    JetOctopus.com Serge Bezborodov Cosinesimilarity vs Euclidean distance
  • 18.
    JetOctopus.com Serge Bezborodov Vectorspace Vector space is multidimensional
  • 19.
    JetOctopus.com Serge Bezborodov ЯкAI проставляє вектори? в процессі навчання на великих обʼємах текстів
  • 20.
    JetOctopus.com Serge Bezborodov ЯкAI проставляє вектори? чим ближче слова знаходяться в текстах, тим вони більш повʼязані по сенсу тим ближче будуть іх вектори
  • 21.
    JetOctopus.com Serge Bezborodov “-дуже дякую, але нащо воно мені треба?” скажіть де взяти лінок?
  • 22.
    JetOctopus.com Serge Bezborodov TextEmbeddings - практичне застосування 1. схожість контенту 2. кластерізація контенту 3. рекомендаційні системи 4. виявлення аномалій 5. переклади і купа іншого
  • 23.
    JetOctopus.com Serge Bezborodov TextEmbeddings - практичне застосування 1. схожість контенту 2. кластерізація контенту 3. рекомендаційні системи 4. виявлення аномалій 5. переклади і купа іншого семантична перелінковка підгонка сторінок під кейворди редиректи семантичний лінкбілдінг?
  • 24.
    JetOctopus.com Serge Bezborodov TextEmbeddings - як почати, що треба? 1. программіст 2. API: - Open AI - Google Vertex - Llama 3. дуже багато терпіння
  • 25.
    JetOctopus.com Serge Bezborodov TextEmbeddings - як почати, що треба? 1. беремо контент сайту - база або краул 2. розраховуємо text embeddings по кожній сторінці 3. зберігаємо в базу (бажано котра підтримує векторні функціі)
  • 26.
    JetOctopus.com Serge Bezborodov TextEmbeddings - redirects З видаленних сторінок робимо редиректи на сторінки, котрі найбільш близьки по розрахунку дистанціі між векторами
  • 27.
    JetOctopus.com Serge Bezborodov TextEmbeddings - підгонка сторінок під кейворди 1. Беремо кейворди та URL із GSC по котрим ранжуються 2. Розраховуємо embeddings по кейвордах 3. Аналізуємо наскільки вектор кейворда відноситься до вектору сторінок, що обрав гугл 4. Аналізуємо який контент є сторінках, що ближче по дистанціі, а ніж обрав гугл
  • 28.
    JetOctopus.com Serge Bezborodov TextEmbeddings - перелінковка Ставимо лінки із сторінок на найбільш близькі сторінки по дистаціі. спрощено:
  • 29.
    JetOctopus.com Serge Bezborodov TextEmbeddings - перелінковка Ставимо лінки із сторінок на найбільш близькі сторінки по дистаціі. спрощено: в реале: 1. робимо повний краул із всієй перелінковкою 2. грузимо логи за 3-6 місяців 3. грузимо дані із GSC в розрізі по сторінках 4. аналізуємо сторінки на котрі треба покращувати перелінковку: - не крауляться ботом - треба підняти позиціі по НЧ хвосту 5. беремо якісні сторінки (крауляться ботом, є трафік) 6. проставляємо з них лінки на underpeform сторінки 7. аналізуємо результат, файтюнимо
  • 30.
    JetOctopus.com Serge Bezborodov TextEmbeddings - перелінковка Ставимо лінки із сторінок на найбільш близькі сторінки по дистаціі. спрощено: в реале: 1. робимо повний краул із всієй перелінковкою 2. грузимо логи за 3-6 місяців 3. грузимо дані із GSC в розрізі по сторінках 4. аналізуємо сторінки на котрі треба покращувати перелінковку: - не крауляться ботом - треба підняти позиціі по НЧ хвосту 5. беремо якісні сторінки (крауляться ботом, є трафік) 6. проставляємо з них лінки на underpeform сторінки 7. аналізуємо результат, файтюнимо JO Inter Linker
  • 31.
    JetOctopus.com Serge Bezborodov TextEmbeddings - лінкбілдінг Наскільки контент ваших донорів співпадає із контентом ваших сторінок?
  • 32.
    JetOctopus.com Serge Bezborodov AI- це не магія
  • 33.