Все мы понимаем важность качества любого товара, будь то телефон, футболка или, скажем, яблоко в супермаркете. О том, как достигать некоторого (высокого, конечно) уровня качества, существует целая наука. Но это же товары, изделия промышленного или, может быть, аграрного, но все же производства. Разве контент штампуют на станках или выращивают, как бройлеров на ферме? Его же создают, творят.

Конечно, отчасти это справедливо. Но, тем не менее, когда мы говорим о контенте, разве процесс его… ну, скажем, генерации не приобретает все более промышленный характер? Разве к этому не нужно всем нам стремиться? Можно сказать и по-другому: именно в той мере, в какой удастся обеспечить заданный уровень качества, производство контента сможет претендовать на характеристику «промышленное».

 Но о качестве контента предметных и конкретных разговоров пока не слышно, хотя, безусловно, это то, что непосредственно влияет и на удовлетворенность заказчика, и на уровень оплаты автора. Предметных и конкретных? Да, не вообще о том, что качество контента – это важно, нужно и хорошо, а опирающихся на измерение этого самого качества. Да как же измерить такую неуловимую субстанцию, воскликнет человек близкий к литературе и далекий от менеджмента! Ну, надо постараться. Что мы и сделаем сегодня в первом приближении.

Общая схема такова:
•    количественные характеристики;
•    литературные достоинства;
•    смысловые достоинства.

Обозначив общую схему, углубимся в детали. Начнем с легкого, потом перейдем к трудному, а на закуску оставим совсем уж неподъемные вещи.
Но прежде всего отметим, что все эти рассуждения мы будем выполнять в предположении, что существует ТЗ (техническое задание) или любой другой документ, в котором заданы желательные характеристики этого будущего контента. Потому что иначе – как же мы сможем говорить о том или ином уровне этого качества, если не установим заранее какие-то желательные для нас показатели? Вернее, конкретные или приблизительные значения тех показателей, о которых речь пойдет ниже.

1    Количественные характеристики

1.1    Объем

Тут все понятно: сколько именно знаков или в пределах «от и до». Единственное уточнение – с учетом пробелов или без. Поскольку в практике используются и один и другой способы подсчета, то это значит, что они оба могут быть нужны в зависимости от конкретных потребностей заказчика.

1.2    Структурированность общая

Задав общий размер, мы можем также выдвинуть определенные требования к количеству разделов и (или) их размерам. А может быть и подразделов. Или глубины дерева структуры. Да, для сайта свадебных букетов это вряд ли актуально. А для юридической, финансовой или экономической тематики?

1.3    Грамотность

Количество ошибок – грамматических и синтаксических. Конечно, в тексте, размещаемом на сайте, ошибок быть не должно. Но они есть в тех рабочих промежуточных редакциях текстов, которые, циркулируют между копирайтером и менеджером. Значит, можно говорить и о таком показателе качества? Несомненно. Это, между прочим, открывает дорогу к тому, чтобы не просто стенать по поводу ошибок, а целенаправленно вести работу по уменьшению их числа. То есть, заниматься управлением качеством.

1.4    SEO-характеристики

SEO-требования к тексту могут быть очень простыми – определенное число вхождений для определенного набора ключевых слов. Но могут быть и весьма сложными. Это в том случае, если оптимизатор выдвинул ряд условий по размещению ключевых слов в начале-конце текста, абзаца, относительному расположению ключевых слов и т.д.

1.5    Лексика (тошнота)

С частотой использования отдельных слов, как правило, ключевых, следует работать в пределах заданных границ, чтобы не проявилась «тошнота». Но ведь и не ключевые слова тоже должны использоваться каким-то заданным, определенным образом! Да, безусловно, но об этом поговорим в следующем разделе.
А пока отметим, что по поводу использования ключевой (SEO) лексики  могут быть заданы некоторые ограничивающие характеристики. Обратившись к Гуглю с вопросом об «анализе текстов» и, в частности, семантическом, можно найти много такого рода сервисов и посмотреть, как они работают. Для нас же сейчас вопрос состоит в том, как можно или нужно эти средства использовать в борьбе за качество контента.

2    Литературные достоинства

Но почему же «достоинства», а не «характеристики»? Так, дань традиции. Можно сказать, что если размер или SEO-характеристика могут быть какими угодно по величине, то о характеристиках литературного раздела заранее известно их желательное значение. Условно называемое достоинством. Высоким, несомненным, заметным, отчасти присутствующим или наоборот (это мы уже двинемся в другом направлении шкалы) – сомнительным или даже напрочь отсутствующим. Видите, раз есть шкала, то значит есть что на ней измерять.
Но тут можно говорить о двух подходах: традиционном, интуитивном или редакторском (назовем эго для краткости Р) и объективном, метрическом (назовем его Х по аналогии с Холстедовскими метриками, известными программистам). Причем, если вспомнить, что вопрос с тошнотой мы уже рассмотрели, то в данном случае речь пойдет о более изощренных и тонких измерениях.

2.1    Подход Р

Откроем какой-нибудь учебник по журналистике (но, конечно, не пособие для начинающих писателей, ведь нас заботит не создание литературных произведений, а именно журналистская задача: донесение до читателя прикладных знаний по заданию заказчика). Мы обнаружим там упоминание о таких желательных качествах текста как структурированность, ясность изложения, определенный хорошо выраженный стиль, богатая лексика и так далее, то есть, все то, что накоплено опытом прошлых поколений и признается в профессиональных кругах в качестве литературного достоинства того или иного текста. Очевидно, такой багаж нельзя проигнорировать, он очень ценен.
Ясно, что в рамках подхода Р есть лишь один путь измерения всего того, о чем речь шла выше - экспертный. Действительно, очень трудно придумать здесь что-то другое. То обстоятельство, что для практического применения имеется лишь экспертная оценка, не должно нас смущать, ведь обходятся же этим способом производители вина и сыра, кинокритики и музыковеды. Вопрос в организации, во что мы детально пока вникать не будем. А пока что, очевидно, остается наиболее распространенной схема, при которой редактор (контент-менеджер, модератор) самостоятельно и единолично проводит оценку, что нужно - правит и ставит текст на страницу. Ему не до измерений, но понравившегося автора он берет на заметку (см. ниже).

2.2    Подход Х

Вероятно, можно сконструировать некие показатели, которые бы давали объективную оценку тех языковых явлений, о которых речь шла выше. Ведь это воспринимается экспертом? Значит, имеет объективные проявления. Да, это не просто, но если даже MS Word дает некоторые возможности в этом смысле, то разве не вправе мы говорить об этом как о принципиальной возможности?  
Сконструировав такие показатели, можно уже было бы говорить и о соответствующих алгоритмах подсчета в конкретных текстах. Они бы дополнили средства анализа, доступные сегодня для решения более простых задач SEO еще одним уровнем метрического анализа – более изощренным. Более того, вполне вероятно, что такие средства уже существуют, просто они не известны широкой аудитории, автору в том числе. Вопрос этот, конечно, чрезвычайно сложный и интересный, но мы и в него также углубляться пока не будем – отложим на будущее. Тем более, что возможно кто-то из читателей этой статьи, имеющий сведения о соответствующих разработках, расскажет нам о действующих инструментах такого рода.

3    Смысловые достоинства.

Если с литературными достоинствами было трудно, то с достоинствами смысловыми еще труднее. Но не так уж безнадежно, как может показаться. Ведь с литературными мы справились. Ну, на каком-то начальном уровне. Но что же можно предложить в части анализа уровня качества представленного текста по смыслу (звучит, конечно, замечательно)?
Здесь, очевидно, можно пойти по схеме «до того – во время того – после того». Имеется в виду процесс создания текста. До того - рейтинг автора. Во время того – технология (креатив и компиляция). После того – оценка или отклик аудитории.

3.1    Рейтинг автора

Конечно, имя автора уже о чем-то говорит. Но хорошо было в XIX веке, когда все достойные внимания авторы были известны читателю. А сегодня? Очевидно, для того, чтобы опираться на такого рода рейтинг, его нужно сначала сформировать. То есть, во-первых, придумать эту саму систему рейтингования авторов. Во-вторых, накопить данные и только потом уж пользоваться каким-то образом, например, при оплате.
Дело, прямо скажем, небыстрое. Но, наверное, очень эффективное: объективность, надежность, простота восприятия. Опыт многочисленных рейтингов блоггеров или авторов электронных библиотек, конечно, нам тут не подойдет. Потому что блоггеры пишут в рамках Web2 – что напишут, то и висит на сайте. Безо всякой критики, оценки, анализа качества – идет контент самотеком, а уже посетители своими кликами его ранжирует. Больше кликов – лучше, меньше – хуже. Уклон в популизм, сенсационность, заискивание перед читательским не всегда сбалансированным вкусом (или «всегда не…). То есть, это не то, что мы называем качественным контентом. Соответственно, в общем случае механизм формирования рейтинга авторов должен быть другим. Он должен отражать политику сайта, нацеливать авторов определенным образом, помогать им понять, что же такое качественный контент именно здесь и сейчас. Потому что завтра политика сайта может измениться, соответственно, вместе с ней и подход к рейтингу.

3.2    Технология генерации

Но есть еще один важный аспект: технологии генерации или создания этого самого контента - креатив и компиляция. Причем, говоря о компиляции, мы имеем в виду, конечно же, корректный рерайт с показателем не ниже, скажем, 95% по Адвего или любому другому согласованному средству контроля.
Понятно, креатив предполагает наличие в тексте неких оригинальных мыслей, описание опыта автора или его оценок тех или иных событий, фактов, а компиляция – только перефразирование всего этого из других текстов. Нет нужды говорить, что тексты разные нужны, тексты разные важны. Но… очень уж разная трудоемкость, соответственно, и качество иное.  
Как же это все измерить? Наверное, нужно просто при заказе текста, согласовании ТЗ явно и четко говорить о технологии – креатив, оригинальный текст или рерайт? Слишком просто? Да, но об этом сплошь и рядом забывают, считая рерайт единственно возможным способом генерации необходимых по тематике сайта текстов. Наверное, жизнь заставляет. Но мы же говорим о показателях качества – можно ли проигнорировать такой важный аспект!

3.3    Оценка

3.3.1    Экспертная оценка

Об этом мы уже говорили выше. Хотя в данном случае, конечно, речь идет о другом наборе экспертов. А все, что можно сказать о технологии или организации такого рода экспертизы, наверное, не меняется в зависимости от предмета этой самой экспертизы.

3.3.2    Отклик аудитории

Прочитал кто-то данный текст – зачет. Есть комментарий – два зачета. Это можно измерять и анализировать средствами администратора сайта в самых различных аспектах. По времени, по географии – это сразу. А, скажем, по тому, вызван интерес со стороны тех или иных категорий зарегистрированных или незарегистрированных пользователей – это нужно принять дополнительные меры. В русле политики сайта.

3.3.3    Цитируемость

Ну, тут тоже все понятно. Если много ссылок извне на данный текст… то он всего лишь популярен. Точно так же, как и непосредственный отклик аудитории, о котором речь шал выше, цитируемость может дополнительно свидетельствовать о том, что данный текст интересен читателям, задевает их, воспринимается как яркий и характерный. Тоже показатель, конечно. Объективный и надежный. Доступный для измерения. Особенно он был бы хорош, если бы удалось эти отклики снабдить весом, опирающимся на некий смысловой авторитет (не просто на посещаемость) внешних источников. Фантастика? Возможно.

4    Выводы

Итак, предложена общая схема оценки качества контента. Автор далек от мысли, что в ней есть что-то принципиально новое для читателя. Кроме, наверное, самой идеи говорить о качестве контента в традициях категорий промышленного производства и менеджмента качества. Тем не менее, можно подумать о практическом использовании этой схемы или ее частей. Это с одной стороны. А с другой – уточнять и развивать отдельные ее фрагменты, предложенные форматы или методы. Не так мало для первого прохода. Будем надеяться, что воспоследует и продолжение.


Гость

Оценка качества контента: проверка на переспам, уникальность, качество, полезность, необходимость, конверсионность.Опис оценки качества контента.

16 ноября в 01:11

vadimpetr_w3

Что Вы, ХотАйс, я не претендую на такую высоту. Этак сразу. Я говорю о том, что существуют объективные критерии. И даю то, что знаю, предлагая развивать, уточнять и пользоваться тем, что есть. То есть предложено в первом приближении. Как пользоваться? Ну, как кому нужно, ближе к его реалиям. Например, молодым - для планирования своего роста. Профи - для оценки своего уровня. Работодателям - для того, чтобы щучить этих самых профи. Ну, кому для чего нужно. Я предлагаю перейти в форум - там сподручне, наверное.

5 июля в 03:07

HotIce

Схемы оценки не увидел. Схема подразумевает последовательность действий. По поводу составления алгоритмов оценки литературных и смысловых достоинств по условным показателям, это занятно. Если можно описать математически, статистически да как угодно, почему мне нравится Булгаков и не нравится Умберто Эко, и на основе этого создать методику - будет замечательно. Я буду платить тому, кто ее постигнет, просто чтоб писал для меня по заданной фабуле. Отклик аудитории и цитируемость, это просто факторы, которые могут приниматься в расчет, либо игнорироваться при экспертной оценке. Так что повторюсь: а схема где?

29 июня в 06:06