Твиты коренных народов - Indigenous Tweets
Твиты коренных народов это веб-сайт, который записывает язык меньшинства Twitter сообщения, чтобы помочь носителям коренных народов связаться друг с другом Основана в марте 2011 г. Кевин Сканнелл, кто проводит исследования в компьютерная лингвистика на кафедре математики и информатики Сент-Луис университет в Сент-Луис, штат Миссури, Соединенные Штаты.[1][2] Цель веб-сайта - дать возможность носителям языков меньшинств общаться в Интернете.[3]
На своей домашней странице веб-сайт отображает список кэшированных языков меньшинств. После выбора языка пользователь попадает в список всех, кто пишет на этом языке. Коренные твиты предоставляют изображение профиля каждого пользователя Twitter и статистику о количестве подписчиков каждого человека. В дополнение к статистическим данным о проценте твитов, написанных человеком на разных языках, в «Твиты коренных народов» есть выбор актуальных тем на различных языках меньшинств.[3]
История
На момент создания веб-сайта в марте 2011 года он каталогизировал 35 языков.[3] 16 апреля 2011 года он записал твиты на 76 языках меньшинств.[4] К 26 апреля 2011 г. сайт поддерживал 82.[5] Каталогизированные языки включают «эзотерический» Гамилараай и "более известные" Гаитянский креольский и Баскский,[6] у которых первое и второе место по количеству ВЧ-динамиков соответственно.[7] валлийский занимает третье место по количеству твитов коренных народов.[7]
Капампанган, занявший седьмое место в последнюю неделю апреля 2011 года, стал первым филиппинским языком, поддерживаемым сайтом.[5]
Сбор данных
Кевин Сканнелл, апрель 2011 г.[3]
В Твиттере коренных народов используется банк данных слов и фраз с языков меньшинств, чтобы найти людей, говорящих на этих языках. В апрельском интервью 2011 г. Новости BBC, Сканнелл сказал, что потратил 8 лет на создание банка данных примерно на 500 языков, просматривая блоги, газеты и веб-сайты.[3]
Коренные твиты собирают данные через Twitter API путем поиска в банке данных слов и фраз с языков меньшинств.[3] Поисковая система веб-сайта не может определить язык твита, если слово написано на нескольких языках. Чтобы избежать этой головоломки, Сканнелл вводит слова, уникальные для данного языка.[4]
Рекомендации
- ^ Scannel, Кевин (2012). "Сайт Кевина Сканнелла". Сент-Луис университет. Архивировано из оригинал на 2012-05-18. Получено 2012-05-11.
- ^ הארץ (29 марта 2011 г.). "האם האינטרנט יציל את הקולות שהוא משתיק?". Гаарец (на иврите). Архивировано из оригинал на 2011-04-22. Получено 2011-04-22.
- ^ а б c d е ж Ли, Дэйв (2011-04-08). «Микроблоггинг на родном языке в Twitter». Новости BBC. Архивировано из оригинал на 2011-04-22. Получено 2011-04-22.
- ^ а б Мартин, Хавьер (16 апреля 2011 г.). "Rastreando lenguas minoritarias". Эль-Паис. Архивировано из оригинал на 2011-04-22. Получено 2011-04-22.
- ^ а б Мануэль, Марк Энтони (26 апреля 2011 г.). «Капампанган занимает 7 место в сети». Бюллетень Манилы. Архивировано из оригинал на 2011-04-30. Получено 2011-04-30.
- ^ Унгерлейдер, Нил (2011-04-14). «Сохранение языков коренных народов через Twitter». Быстрая Компания. Архивировано из оригинал на 2011-04-22. Получено 2011-04-22.
- ^ а б Олвен, Мирс (2011-04-15). «Баскский язык - второй по количеству твитов язык меньшинства в Твиттере». EITB. Архивировано из оригинал на 2011-04-22. Получено 2011-04-22.