Шингл

Шингл – це частинка, цеглинка – одне з багатьох значень англійського слова shingle. У сфері просування сайтів шингл означає частинки-цеглинки, з яких будується текст, і є основою для самого надійного методу перевірки унікальності тексту. Шингл в цьому значенні має пряме відношення до лінгвістичного аналізу тексту. У 1997 році Andrei Broder, високопоставлений співробітник Yahoo! запропонував використовувати його у цій галузі. Користуючись дослідженням тексту за допомогою шинглів можна безпомилково відокремити унікальний текст від синонімізованого контенту. В даний час, коли SEO-оптимізація набуває професійного рівня, питання шинглів і роботи з ними стає ще більш актуальнішим.

Підготовка тексту

Шингл – це невеликий фрагмент тексту, оброблений за спеціальною методикою для аналізу. Ця методика – канонізація – полягає в тому, що текст зпрощується на всі несуттєві для розуміння і граматики слова (сполучники, прийменники, вигуки) і розділові знаки.

Cкладання шинглів

Другий етап роботи з текстом: безпосереднє виділення шинглів. Для цього в першу чергу потрібно визначити довжину шингла. Чим менший шингл, тим більше роботи і тим точніший аналіз. Мінімальний шингл дорівнює трьом словами, максимальний – восьми. Вибирати довший шингл не має сенсу, тому що, така перевірка буде мати велику похибку. Одне з правил складання шингла – метод накладання, тобто з захопленням як мінімум одного слова з попереднього шингла. Саме це дасть можливість точної та якісної перевірки всіх слів.

Алгоритм шинглів

Далі програмістом розраховується контрольна сума тексту. Алгоритм шингла передбачає порівняння шинглів двох різних текстів, визначаючи, чи не є один з них, дублікатом іншого. Пошукові системи, в які закладено програмний метод шинглової перевірки, обдурити дуже важко. Вони знаходять подібні документи і порівнюють число збігів шинглів, чітко виявляючи відсутність унікальності. Тому при розмноженні тексту потрібна “хірургічна” робота по сінонімізації, розбавленню і структуруванню тексту, заміні фразеологічних висловів, так щоб зробить його не схожим на оригінал та надати унікальності.