Каждому студенту рано или поздно придется столкнуться с проверкой антиплагиат. Обычно на плагиат проверяют только курсовые, дипломные и диссертационные работы. Чтобы получить хорошую оценку, нужно показать высокий результат оригинальности текста. Однако, многие учащиеся используют текст из интернета, который обязательно обнаружится при проверке работы.
В этой статье мы расскажем, как обмануть антиплагиат в 2023 году. Опишем 12 методов, которые помогут скрыть любые заимствования и получить 80-90% уникальности работы. Читайте статью до конца, и вы узнаете, как проверить свою работу самостоятельно.
01 Что такое антиплагиат
Антиплагиат – это система поиска плагиата в любом тексте. Каждый студент, который хочет обмануть антиплагиат, должен знать, как работает антиплагиат. Сейчас мы постараемся кратко объяснить принцип действия.
Любая студенческая работа проверяется за несколько минут. Проверка текста проводится через миллионы текстов в открытых и закрытых ресурсах интернета. Поэтому не стоит надеяться, что скаченная работа пройдет проверку на оригинальность.
20 эффективных способов обойти антиплагиат в 2023 году
Программа антиплагиата загружает весь текст и разделяет его на небольшие отрезки, примерно по 3-5 слов. Дальше система ищет повторы этих комбинаций. И если находит, то подсвечивает их красным цветом. Таким образом, даже если было скопировано всего лишь 1 предложение, то оно будет найдено.
После того, как обработка завершится, проверяющий сможет увидеть процентное соотношение оригинального текста, заимствованного из интернета и правильного цитирования.
Если показатель оригинальности будет ниже допустимого порога, то студент не сможет пройти проверку антиплагиат. Каждому студенту нужно знать, какой процент уникальности должен быть, чтобы пройти Антиплагиат . Обычно минимальный порог уникальности составляет 60-70%.
Таким образом, если вы хотите получить хорошую оценку без особых усилий, то читайте дальше, как обмануть антиплагиат самостоятельно.
Лайфхак
Если вам нужно срочно поднять процент оригинальности, то рекомендуем заказать помощь профессионалов. На нашем сервисе Анти-антиплагиат.рф предоставляется услуга кодирования документа. Ваш текст никак не изменится, зато процент поднимется до 80-90%. Понадобится всего лишь пара минут. Мы гарантируем качество работы и предоставляем обработанный текст без предоплаты, чтобы вы смогли убедиться в повышении уникальности.
02 Как обмануть антиплагиат в 2023 году — 12 секретов
13 действенных способов как обойти антиплагиат и 3 причины этого не делать
Чтобы быть во всеоружии, недостаточно только читать наш телеграм-канал. Хотя информация там действительно полезная и поможет написать любую работу без труда. А если хотите экономить, заходите в группу.
Но что делать, если хочется не писать, а просто взять откуда-то готовую информацию и выдать ее за свою?
Сегодня каждый преподаватель использует интернет для поиска «злостных нарушителей» – тех, кто выполнял задание (реферат, контрольную, курсовую) не самостоятельно, а скачивал его из интернета. Чаще всего для повышения оригинальности текста используют программу «Антиплагиат вуз».
Как повысить оригинальность в антиплагиат самостоятельно 2023
Что такое антиплагиат? Это краткий отчет, который позволяет быстро определить подлинность и покажет кусок заимствованного текста.
У многих вузов своя база учебных работ или они пользуются расширенной версией программы. Все это усложняет процесс подготовки работы.
Как же студенты пишут курсовые, дипломные, диссертации, если эти труды обычно на 70% состоят из заимствований (терминов, цитат, теорем, формул и т.д.)?
Давайте начистоту: если писать работу полностью самостоятельно, то и процент уникальности будет высоким. Но такой труд отнимает много времени и сил, поэтому студенты идут на хитрость и «копипастят».
Перечисленные ниже методы повышения уникальности текста лучше не использовать! Мы лишь приводим примеры, как с этой задачей справляются другие. Вам же настоятельно рекомендуем вручную перерабатывать всю информацию.
Актуальность и уникальность работы: как обойти антиплагиат?
Чем более популярна тема, тем сложнее написать уникальную работу. Большинство трудов состоит из уже написанного ранее: цитат, терминов, формул и т.д. Студент добавляет лишь собственную точку зрения и выводы, к которым пришел в ходе выполнения.
Можно выбрать современную и актуальную тематику работы. Но в таком случае часто непонятно, где брать качественную информацию для курсовой или реферата. Да и преподаватели не всегда успевают за стремительно развивающимся миром и не могут проверить правильность расчетов и результатов.
Со старыми и стандартными темами все как-то спокойнее. Найти нужный материал гораздо легче, но дотянуть его уникальность будет сложнее.
Есть еще одна причина, которая может превратить работу с антиплагиатом в настоящий кошмар: неадекватные или очень строгие требования преподавателя. Если при написании курсовой или диплома обычно хватает 70-80% уникальности текста, то иногда особо требовательные преподаватели могут повысить планку до 90%.
Но как тогда написать реферат или курсовую без плагиата? Мы провели тщательное расследование и спешим поделиться с вами своими результатами, как с этим справляются другие.
6 стадий уникализации текста
Перед тем как изучить эффективные способы антиплагиата и повысить оригинальность реферата или любой другой работы, предстоит выполнить простой алгоритм действий, чтобы избежать коварных ловушек преподавателя:
- Выбор сервиса проверки уникальности. Старайтесь выбрать популярный и максимально строгий сервис с обширным функционалом. В университете вашу работу будут проверять серьезными платными программами. И выбор заведомо мощного ресурса поможет избежать проблем с уникальностью. Особенно строгими среди студентов числятся следующие сервисы проверки текста на антиплагиат: ETXT, Advego Plagiatus, ресурсы Text.ru, Findcopy и Antiplagiat ру.
- Проверка уникальности. С помощью специальной программы или сервиса запустите проверку текста на уникальность. Интересно то, что разные программы/сервисы могут показывать разный процент уникальности текста (например, в программе Advego Plagiatus – 95%, а в ETXT – 60%). Хитрость в разных алгоритмах работы. Так, одни программы работают по методу шингла (определенного количества последовательных слов), другие – по оценке всего текста.
- Сохранение изначального варианта. Обязательно делайте резервную копию начального текста, даже если у него зафиксирован низкий процент уникальности. Так вы всегда можете вернуться к началу, если уже обработанный текст покажется перенасыщенным, бессмысленным и невосстанавливаемым.
- Выбор способа обхода антиплагиата. Сразу после создания резервной копии выберите оптимальный метод обхода системы проверки уникальности. Их будет много, и более предметно обсудим их далее в статье.
- Повышаем итоговую уникальность на 5-10% больше необходимого. Дело в том, что вузовские или любые другие платные программы, которыми может воспользоваться преподаватель, работают с продвинутыми инструментами. В итоге они почти всегда сильно занижают процент уникальности.
- Сохранение готового варианта. Как только работа сделана, несите ее на проверку! Самое время узнать, как вы справились с задачей.
Итак, мы определили примерную последовательность действий для повышения уникальности текста. Самое время рассмотреть действующие методики, как пройти антиплагиат диплома, курсовой, реферата или другой работы в 2023 году бесплатно. Советы собраны от опытных специалистов и прошаренных студентов из просторов всемирной паутины.
13 способов обойти систему антиплагиат и повысить оригинальность диплома/курсовой/реферата бесплатно
Остановимся на самых популярных и проверенных бесплатных способах обхода системы антиплагиат в 2023 году.
Глубокий рерайт
Самый честный и проверенный способ, как обхитрить систему и повысить оригинальность текста в антиплагиате самостоятельно – это написать то же самое, но своими словами. Это и есть глубокий рерайт. По крайней мере, отзывы об этом методе самые лучшие (даже у преподавателей). Да и обманом системы, если уж на то пошло, этот способ назвать нельзя.
Просто берете неуникальные куски текста, которые сервис считает плагиатом, и перерабатываете их, переписывая ту же мысль своими словами. Старайтесь опустить излишние детали, выделить тезисы и главные мысли.
Добавление синонимов и эпитетов
Часто используемые слова старайтесь заменить близкими по значению понятиями. При этом не обязательно должен меняться порядок слов в предложении.
Эпитеты также помогают преобразить исходный текст, делая его красочным и ярким. Но вот для сухого научного труда такой прием вряд ли подойдет.
Гораздо сложнее иметь дело с таблицами и формулами. Тут уж никакие эпитеты и синонимы не помогут.
Откроем секрет: вставляйте таблицы и формулы в работу картинками (делайте скриншоты, например).
Если этого не сделать, сервисы проверки будут расценивать информацию в таблицах как дубли с других ресурсов. А вот распознавать текст на картинке они еще не научились.
Синонимайзеры
Этот способ настоятельно не рекомендуется использовать для крупных кусков текста, потому что получится откровенная ерунда. А вот для подъема уникальности всего на пару процентов может быть достаточным.
Итак, находите на просторах всемирной паутины подходящую программку, вводите отрывок текста и получаете обработанный кусок, который и поднимет его уникальность на заветные несколько процентов!
Использование автоматических переносов
Этот способ поможет поднять оригинальность текста лишь в малой степени. Но это хороший прием, если нужно лишь «подмарафетить» курсовую или диплом.
Итак, в документе MS WORD выставляете автоматический перенос слов. Как это сделать, посмотрите на картинке ниже:
Как это поможет обойти программу « Антиплагиат вуз » ? Дело в том, что при копировании такого текста в другие сервисы часть слов как бы обрезается, что позволяет программе воспринимать их как уникальные.
Метод шингла
Шингл – это определенное количество слов в определенной последовательности в тексте. На основе метода шинглов работает большинство программ проверки уникальности.
Изменяя одно слово из этой цепочки, вы меняете процент оригинальности текста.
Помните, что каждое последующее слово может начинать новый шингл или быть частью предыдущего. Так образуются своеобразные цепочки из фраз.
Если программа показывает, что не уникален целый абзац, попробуйте изменять каждые 2-3 слова. Так вы поменяете практически все шинглы, существенно повысив уникальность.
Иногда для повышения оригинальности изменяют каждое первое и последнее слово шингла. Но это не всегда легко, так как неясно, где он начинается и заканчивается.
Перевод текста на другие языки и обратно
При переводе текста на другой язык изменяется его структура. А при обратном переводе с иностранного новая структура сохраняется. Кроме того, автоматические переводчики часто заменяют оригинальные слова текста синонимами.
В качестве достойной альтернативы постарайтесь найти источник информации на зарубежных сайтах, так как большинство антиплагиат-сервисов занимается поиском совпадений на русскоязычном пространстве.
Замена русских букв на греческие
Многие модернизированные системы проверки видят замены латинскими буквами и обходят их стороной. Хотя со старыми системами и этот фокус может получиться.
А вот до греческого языка «дошли» немногие. Некоторые умельцы заменяют отдельные буквы в русском тексте на аналогичные буквы греческого алфавита.
Изменение часто повторяющихся слов
В тексте могут часто встречаться одни и те же слова. Просто замените их синонимами, фразами, местоимениями и другими подходящими по смыслу словами. Так вы повысите оригинальность.
Изменение предложения с конца
Речь идет о сложносочиненных и сложноподчиненных предложениях. Достаточно грамотно поменять две части местами, как автоматически повышается и уникальность документа.
Проследите, чтобы не менялся смысл текста.
Использование слов-паразитов
Например, слово «непосредственно» можно использовать практически в любом предложении, так как оно обязательно подойдет по смыслу хоть к какому-то слову.
В словарном запасе активного читателя обязательно найдется с десяток таких слов, которые можно чередовать и использовать во всем тексте. Но не переборщите! Лишняя вода в тексте не сыграет на руку при проверке. Перегруженный словами текст доносит основную мысль менее эффективно. Если же мыслей нет, лейте воду.
Помощь со стороны
Если есть хороший знакомый, можно доверить ему доработать ваш текст. Пусть перескажет работу своими словами, а вы перепишете.
Кстати! Если знакомых нет, можно обратиться в специальный студенческий сервис, где за чисто символическую сумму повысят уникальность или вовсе создадут работу с нуля. К тому же, для всех наших читателей сейчас действует скидка 10% на любой вид работы.
Маленькая хитрость: если не хотите заморачиваться с повышением уникальности текста, а работу сдать надо, отнесите ее преподавателю не в электронном виде, а распечатанную. Вряд ли у него хватит терпения и сил на сканирование, распознавание текста и последующее исправление ошибок, чтобы выявить плагиат.
Хотите удивить его еще больше? Напишите работу от руки. Конечно, такой способ больше подойдет для подготовки реферата, а не такого объемного труда, как дипломная или курсовая работа. Иначе вы рискуете остаться без руки. Руководитель явно будет шокирован, но и придираться будет меньше.
Даже если он уверен, что содержимое скопировано, студент хотя бы приложил усилия, чтобы прочитать, а потом еще и переписать текст. Значит, все же что-то в его голове отложилось.
Методы уникализации текста, которые не работают
Не используйте для повышения уникальности старые способы обхода антиплагиата, такие как:
- замена букв кириллицы латинскими буквами;
- вставка большого количества вводных слов, эпитетов;
- синонимайзинг крупного отрезка или всего текста.
Умные программы уже давно могут определить, где в тексте присутствует неуместная латинская буква. Это делается путем прогона информации через проверку орфографии.
Эпитеты и вводные слова не подходят для текстов узкоспециализированной и научной направленности.
Синонимайзинг больших отрезков текста – отличный способ и самому вдоволь насмеяться, и преподавателя рассмешить.
Не стоит использовать и следующие приемы:
3 причины, почему не стоит обманывать антиплагиат
Есть несколько причин, почему лучше действительно поработать над курсовой или дипломом, а не искать надежные способы, как можно обойти антиплагиат и поднять оригинальность текста самостоятельно:
- вы рискуете попасться и провалиться;
- вы рискуете попасться и быть отправленным на повторную доработку;
- вы рискуете попасть на устаревшую программу.
В первом случае преподаватель просто отправит восвояси и не захочет больше иметь с вами дело. Не у каждого хватит терпения и сил простить того, кто пытался обмануть программу антиплагиат и препода.
Во втором случае у преподавателя хватит сил и мудрости вас простить, но он отправит вас доделывать работу по-человечески. То есть фактически потеряете время, которое было потрачено на переработку текста и повышение уникальности. При этом все равно нужно будет пойти и выполнить то, чего вы так усердно пытались избежать. А испорченная репутация теперь будет преследовать всегда.
В третьем случае есть вероятность использовать допотопную версию программы, в то время как у преподавателя будет полный набор модернизированных инструментов для « поимки преступников » .
Помните: с каждым днем программы и сервисы становятся все умнее. То, что вы использовали неделю назад, сегодня уже может не прокатить.
Как проверить реферат/курсовую/дипломную на плагиат онлайн
Допустим, вы подготовили материал и хотите проверить работу на плагиат бесплатно, чтобы идти на проверку во всеоружии. Для начала узнайте, каким сервисом пользуются преподаватели в вашем вузе.
Разные системы проверки текста на плагиат используют разные алгоритмы и дают разный результат.
Вот топ популярных сервисов, позволяющих проверить оригинальность реферата, курсовой или диплома на плагиат онлайн и бесплатно.
Не переживайте, если с первого раза ничего не получается. Если вы отчаялись и не знаете, как сделать, чтобы курсовая, дипломная, реферат или любой другой текст прошли антиплагиат, обратитесь в студенческий сервис. Мы помогаем решать любые вопросы, связанные с обучением.
Вопрос/ответ
Как проверить курсовую/дипломную онлайн?
Как повысить оригинальность текста в антиплагиате самостоятельно?
- Глубокий рерайт – тщательно переписываем работу своими словами.
- Добавление синонимов и эпитетов – заменяйте слова синонимами, а к существительным добавляйте прилагательные. Только не переборщите. Это же дипломная всё-таки.
- Синонимайзеры – используйте их только для небольших отрывков текста.
- Перевод текста на другие языки и обратно – когда переводишь с одного языка на другой, меняется структура предложения. Это нам и надо, чтобы повысить уникальность на пару процентов.
- Изменение предложения с конца – достаточно грамотно поменять две части местами, как автоматически повышается и уникальность документа.
- Использование слов-паразитов – например, слово «непосредственно» можно использовать практически в любом предложении, так как оно обязательно подойдет по смыслу хоть к какому-то слову.
Как не стоит уникализировать текст?
- Менять слова местами.
- Менять предложения и абзацы местами.
- Склеивать и разбивать предложения.
- Менять знаки препинания
- Изменять фон или цвет текста.
- Использовать устаревшие программы для проверки работы на плагиат.
Мы поможем сдать на отлично и без пересдач
- Контрольная работа от 1 дня / от 120 р. Узнать стоимость
- Дипломная работа от 7 дней / от 9540 р. Узнать стоимость
- Курсовая работа 5 дней / от 2160 р. Узнать стоимость
- Реферат от 1 дня / от 840 р. Узнать стоимость
Наталья – контент-маркетолог и блогер, но все это не мешает ей оставаться адекватным человеком. Верит во все цвета радуги и не верит в теорию всемирного заговора. Увлекается «нейрохиромантией» и тайно мечтает воссоздать дома Александрийскую библиотеку.
Источник: zaochnik.ru
Так Систему не обойти
Последний учебный год, апрель месяц. Студента все чаще и чаще начинают посещать мысли о том, что надо бы заняться дипломной работой. Заняться — в смысле придумать, как быстро состряпать нечто, что будет хотя бы созвучно той теме, которую, вроде как, утверждали с научным руководителем.
А, да, надо хотя бы на 80 страниц, еще и соблюсти ГОСТы там всякие… Понятное дело, самому столько связного текста уже не успеть набрать (да еще и могут начать в суть работы вникать, ну его!). Очевидно — надо брать готовую работу, которую уже защитили, работу качественную, проверенную и одобренную. Знакомая всем нам ситуация. Открытым остается единственный вопрос — как сделать так, чтобы работа прошла проверку на заимствования… Поиск в интернете и общение с коллегами по несчастью приводят студента к следующим вариантам решения проблемы:
- Написать работу самому;
- Перефразировать текст (дорого и сложно);
- Обхитрить систему с помощью «технических обходов».
Давайте посмотрим, какими бывают технические обходы, как мы их отлавливаем и почему их применение — не самая хорошая идея…
Перефразирование может помочь выдать чужой текст за собственный, если оно выполнено качественно. Однако, качественное перефразирование само по себе является очень трудозатратным процессом, на который у студента, скорее всего, нет времени и средств. Простые же способы перефразирования (например, синонимизация) дадут результат, который не только обнаружится системой «Антиплагиат», но и, вполне вероятно, развеселит научного руководителя и аттестационную комиссию.
Таким образом, мы подходим к самому творческому и самому популярному среди студентов средству — техническим обходам — преобразованиям документа, которые, не меняя отображения исходного документа, изменяют текст, извлекаемый проверяющей системой.
C точки зрения работы с техническими обходами (далее будем называть их просто «обходами») перед системой «Антиплагиат» стоят две задачи:
- Обнаружение потенциальных обходов и уведомление пользователя о них;
- Очистка проверяемого текста от обходов.
Общую схему обработки обходов можно описать следующим образом:
- Обнаружение обходов, сохранение информации о них;
- Очистка извлеченного текста от обходов;
- Определение «подозрительности» документа на основании найденных обходов;
- Отображение информации о подозрительности пользователю, отображение найденных обходов.
Вот как это выглядит на практике.
Документ в формате docx:
Проверяем документ без функционала обнаружения обходов:
Документ имеет стопроцентную оригинальность.
Проверяем документ с включенным функционалом обнаружения обходов и видим, что оригинальность падает до 0.
Кроме того, система помечает документ как «Подозрительный» и показывает пользователю, где и какие именно обходы были обнаружены:
Поскольку целью технических обходов является повышение оригинальности документа, интересно классифицировать их по тому, каким образом они влияют на проверку документа. Исходя из того, что основным элементом проверки документа на заимствования являются слова документа, обходы можно разделить на следующие типы по их влиянию на извлекаемые слова документа:
- Изменение слова (слово в извлеченном тексте отличается от слова, отображаемого в исходном документе);
- Добавление слова (слово не видимо в исходном документе, появляется в извлекаемом тексте документа);
- Удаление слова (слово видимо в исходном документе, отсутствует в извлекаемом тексте документа);
- Разбиение слова (в исходном документе слово отображается нормально, в излеченном тексте оно разбито на две или более части);
- Слияние слов (в исходном документе отображается несколько слов, в извлеченном тексте они слиты в одно слово).
Давайте посмотрим, с какими обходами мы сталкиваемся. Начнем от простых и пойдем в сторону наиболее интересных.
Текстовые обходы
Обходы данного типа никак не привязаны к формату документа, они меняют строковое значение слов таким образом, что те продолжают выглядеть идентично исходным словам.
Омоглифы
Одним из первых зафиксированных нами способов обхода является замена букв на омоглифы — на визуально схожие с исходными буквами символы, имеющими иное значение. Омоглифия применялась с самых ранних дней существования системы «Антиплагиат», и, несмотря на то, что она нами давно уже отлавливается, мы все еще встречаем подобные обходы в студенческих работах.
Омоглифы легко находить и очищать, когда известен язык каждого слова. Мы умеем достаточно качественно определять язык каждого слова текста, даже когда текст содержит несколько языков и большое количество «мусора» (омоглифов и прочих лишних символов). Как — это тема для отдельной статьи. Имея язык слова и список возможных омоглифов для языка, мы восстанавливаем буквы исходного языка и сохраняем информацию о найденных омоглифах.
Непечатные символы
Другим способом изменения строкового значения слов без существенного изменения их отображения является использование невидимых либо слабо видимых Unicode символов. Вставка таких символов в слово меняет строковое значение слова, при этом практически не меняя его отображение.
Много подобных символов находятся в Unicode категориях «Other, Control» и «Mark, Nonspacing».
Данные символы система просто удаляет и, при их большом количестве, оповещает пользователя о подозрительности документа, отображая очищенные непечатные символы в отчете.
Обходы в pdf
Как мы уже рассказывали ранее, ключевым форматом при обработке документов у нас является pdf. Все остальные типы документов мы конвертируем в pdf, благодаря чему основная логика обработки документов у нас становится унифицирована для всех поддерживаемых форматов. Таким образом, обходы, которые можно реализовать в pdf документах, для нас представляют особый интерес.
Мелкий текст
Способ обхода, который одним из первых приходит на ум — сделать что-то маленьким и невидимым. Полученный таким образом текст не виден при просмотре оригинального документа, однако извлекается системой. Реализация очень проста — выставить у текста минимальный размер шрифта, изменить цвет текста. Настолько же прост отлов обходов данного типа — просто проверяем размер шрифта текста и геометрические размеры отдельных слов. За счет маленьких размеров студенты часто добавляют целые абзацы такого скрытого текста на страницу:
Отображение обнаруженной попытки обхода:
Изменение цвета текста на фоновый
Несмотря на то, что данный способ часто применяется в комбинации с предыдущим, более интересно его независимое использование. Дело в том, что нам для обнаружения и очистки обхода достаточно определения того, что хотя бы один параметр слова/символа имеет «подозрительное» значение. И, если определение маленьких размеров слова тривиально, то определение текста, цвет которого совпадает с фоновым, является более сложной процедурой.
Обнаружения невидимого текста осложнено следующими обстоятельствами:
- Из pdf не всегда возможно получить цвет конкретного символа;
- Фон слова может быть не белым. Более того, слово может находиться на фоне изображения;
- Слова и символы могут наезжать друг на друга.
Для устранения первых двух сложностей «невидимость» текста мы определяем посредством анализа отрендеренного изображения страницы документа:
- Определяем область страницы, содержащую слово;
- Вычисляем дисперсию полученной области. Если дисперсия ниже определенного порога — в анализируемой области имеем однородный цвет, никаких букв не видно. Следовательно, налицо попытка обхода системы.
Слова и символы, спрятанные друг за другом
Невидимые символы невозможно обнаружить посредством анализа области, в которой они находятся, если эти символы скрыты за другими «видимыми» символами. Поэтому для обнаружения подобных «спрятанных» символов у нас существует отдельная процедура, анализирующая пересечение областей символов и помечающая те символы, которые в значительной степени перекрываются другими.
Текст в виде изображений
Что будет, если взять и заменить часть текста изображениями, содержащими этот текст? При должной аккуратности внешне все будет выглядеть так, будто ничего в документе не изменилось, однако при извлечении текстового слоя, естественно, слова с картинок не извлекутся. Для закрытия данной бреши мы применяем оптическое распознавание текста.
Обходы, использующие особенности конвертации docx в pdf
Конвертация документов в pdf — нетривиальная задача. О том, как мы выбирали наиболее подходящее нам решение, можно почитать тут. К сожалению, даже наилучший из проанализированных нами вариантов неидеально конвертирует документы в pdf. Некоторые «особенности» конвертации активно используются при попытках обхода системы.
Формулы
Формулы и ряд других объектов, содержащих текст, «теряются» после конвертации в pdf. Таким образом можно попытаться скрыть целый абзац текста, или, например, каждое второе слово в тексте:
При конвертации в pdf получаем следующий результат:
Для обнаружения и очистки этого и других обходов, заточенных на особенности конвертации docx в pdf, мы анализируем и вычищаем исходный docx файл. В частности, при обнаружении существенного количества формул в документе мы их заменяем на простой текст, который сохранится при конвертации документа в pdf. Более того, мы запоминаем позиции формул, которые мы обработали, и при необходимости сообщаем пользователю о подозрительности проверяемого документа и подсвечиваем текст, который мы восстановили из формул.
Масштаб, маленькое межсимвольное/междустрочное расстояние
При конвертации в pdf не учитывается ряд свойств текста: масштаб, межсимвольное и междустрочное расстояния. Это позволяет добавлять невидимый в исходном документе текст (например, у него выставляется очень маленький масштаб), который в pdf становится нормальным, ничем не выделяющимся текстом. Реализация обхода (docx):
Результат конвертации в pdf (цвет мы меняли сами):
Единственная возможность отловить данный текст — найти его в docx и сохранить информацию о нем. Если мы обнаружили много такого текста в документе — помечаем документ подозрительным и показываем пользователю, где мы нашли в документе текст с подозрительными атрибутами.
Разбиение слова на части
Интересный частный случай применения свойств, описанных в предыдущем пункте — добавить в слово пробел и скрыть его. В исходном документе слово будет выглядеть нормальным, слитным, а после конвертации документа в pdf разобьется на две части, так как пробел станет полноразмерным. Отлавливаем подобный финт ушами примерно так же, как и в предыдущем пункте. Реализация обхода (docx):
Результат конвертации в pdf:
Отображение обнаруженного обхода: