Онтология переоценена: категории, ссылки и теги

Evg Evg 18 Июля 2022

Пока занят локализацией «Фасетов» (тем, категорий, разделов), навигации в общем.

Локализация фасетов
Пример, переключил «язык» в настройках профиля. Переведена не только навигация, но и темы и т.д.

Стоит прочитать сегодня статью, первую часть которой размещаю ниже.

На сайте, где эта статья была ранее больше её нет, сайт видимо сменил движок, базу и всё. Статья осталась только в архиве. Сейчас думаю, может быть стоит её вообще всю сюда перенести. Тема то статьи нужная, хотя, может и заумная, академическая, мне такие нравятся.

Их хорошо читать спокойно, без суеты. От них обычно толк позже появляется.

Поехали…


Эта статья основана на двух докладах, которые автор (Clay Shirky's) сделал весной 2005 года: один на конференции O'Reilly ETech в марте под названием «Онтология переоценена», а другой на IMCExpo в апреле под названием «Фолксономии и теги: подъем разработанная пользователями классификация». Письменная версия представляет собой сильно отредактированное соединение этих двух выступлений.

Сегодня я хочу поговорить о категоризации и хочу убедить вас, что многое из того, что, как мы думаем, мы знаем о категоризации, неверно. В частности, я хочу убедить вас, что многие из способов, которыми мы пытаемся применить категоризацию к электронному миру, на самом деле плохо подходят, потому что мы переняли привычки ума, оставшиеся от более ранних стратегий.

Я также хочу убедить вас, что-то, что мы видим, когда видим Интернет, на самом деле является радикальным разрывом с предыдущими стратегиями категоризации, а не их расширением. Вторая часть разговора более умозрительна, потому что часто бывает так, что старые системы ломаются до того, как люди узнают, что придет им на смену. (Любой, кто наблюдает за музыкальной индустрией, может увидеть это в действии сегодня.) Вот что, я думаю, происходит с категоризацией.

Вместо этого, я думаю, появятся гораздо более органичные способы организации информации, чем позволяют наши нынешние схемы категоризации, основанные на двух элементах — ссылке, которая может указывать на что угодно, и теге, который является способом прикрепления меток к ссылкам. Стратегия маркировки — маркировка в свободной форме, без учета категориальных ограничений — кажется рецептом катастрофы, но, как показал нам Интернет, вы можете извлечь удивительную пользу из больших беспорядочных наборов данных.

Читать далее (англ.): web.archive.org

P.S. статья для меня очень спорная, но классическая.

Одна из самых больших проблем с предварительной категоризацией вещей заключается в том, что она вынуждает классификаторов браться за две работы, которые исторически были довольно трудными: чтение мыслей и гадание. Это заставляет классификаторов угадывать, что думают их пользователи, и делать прогнозы на будущее.

А вот это верно… Где должен «лежать» тот или иной товар всегда спорно. Увы, это недостатки вообще полок, которые мы создаем, чтобы потом положить туда что-то. То нужной полки нет, то их количество избыточно и мы просто теряемся… Вот проблема категорий, тегов и т.д.

3 Ответа

  1. German German 18 Июля 2022

    Мы читали эту статью ранее. Автор провел серьезное исследование, которое одно из первых критикует «жесткий подход с категориями». Он остановился в рассуждениях на тегах?

    1. Evg Evg 18 Июля 2022 (ред.)

      «Теги», мы используем их тут, но хотелось бы пойти дальше. А для этого надо вернуться опять к логике рассуждений, перехода с категорий на теги.

      А дальше, это вот что. Тут статья знает про теги. Через таблицу связи, но знает. Ещё делают (проще) через поле и номера тем (категорий), через запятые проставляют, — это не важно.

      Статья, сайт знает про теги, категории или что там еще есть. Так во всех магазинах, каталогах и т.д. Мы же товару говорим, помечаем его, привязываем его, где он должен быть. А это не то, что хочу.

      Хочу попробовать, чтобы сайты собирались в теме, в зависимости от свойств Темы и Сайта. Это как система рекомендации. Там нет привязки сайта (ни в какой форме) к навигации.

      Навигацию (теги), все со всеми, связанные и т.д. мы строим — люди. Описываем сайты, ставим им метки свойств — люди делают. Но в каком разделе будет сайт, — это машина. От помеченных свойств это будет работать. Вот, что хочу попробовать. Это то, как должна работать фасетная схема если упрощать.

      А до этого, как сейчас, просто гибко всё, но ручной труд везде. И это не фасеты в истинном понимания этого слово. А теги, все со всеми… через таблицы связи… это не то.

  1. Evg Evg 19 Июля 2022 (ред.)

    У меня по поводу многоязычности есть множество вопросов. Дело в том, что до этого сталкивался с этой темой только со стороны администрации. Давайте посмотрим пример в одном каталоге, как там сделана локализация на уровне контента (категорий).

    Локализация
    Посмотрите на вкладку Английский. Это включен Английский язык. И чтобы участники видели это поле переведенное, оно должно быть заполнено. Эта работа для персонала. И еще… языки включаются не просто так. Если мы добавили язык, мы должны его поддерживать.

    На этом сайте включены сразу 6 языков. Будет 6 вкладок. Мы можем конечно не заполнять отдельные языки, но тогда правильно, их выключить. А если оставить будут варианты.

    В примере выше не стоит так вопрос. Там все есть, все проверяется и заполняется. Там деньги люди получают за это. Там просто не может быть такой ситуации: какая-то категория на англ. будет пустой. Её забудут перевести.

    А тут… не будет ли это слишком сложно и избыточно. Не знаю. Надо подумать. В программном плане полностью реализовал, повторил вариант, которые представлен на фото выше. Но добавлять на GitHub надо повременить. Что-то все усложняется и это не нравится.