Rimon Lusi (fotovivo) wrote,
Rimon Lusi
fotovivo

Продолжение пятничного банкета

[Вдогонку к крестикам-ноликам, ссылочки на collaborative-drawing:]Виртуальная "Классная доска" - 6 лучших ресурсов
Лучших - по мнению автора подборки:
плюс к совместному рисованию - возможность вставлять картинки, ролики, файлы svg; назначать пользовательские роли;
чат, аудио-(а где-то и видео-)конференции, приват - всевозможный функционал для совместных проектов.

Гугл.Документ тоже так может - docs-drawing-tool collaborative-drawing


Сфейсбучено:



Выражение понравилось в приписке: "контролировать свою холерность" (ĥoleremon на эсперанто)
("kolerikemon" надо бы, но как есть даже колоритней: "холера эдакая!")


[А этого лучше не видеть]



С Хабра, для любознательных:

Как развивается "умный поиск"


Пирожки в дистрибутивной семантике

[Заглянуть >>>]
"...за счёт врождённой способности дистрибутивных векторов показывать степень семантического сходства лексем самым что ни на есть действительным числом (чем меньше угол между векторами слов, тем с большей вероятностью эти слова близки по смыслу — косинусная мера, классика жанра, в общем).
Например, «принцесса» и «пастух» гораздо менее близки, чем «пастух» и «овца»: 0.139 против 0.603, что, наверное, логично — вектора национального корпуса должны отражать суровую реальность, а не сказочный мир Г.Х. Андерсена.
Способ же расчёта глубины корреляции (диффузии) запроса и пирожка проявился практически сам собой (дёшево и сердито) как нормализованная сумма сходств каждого слова из списка X с каждым словом списка Y (стоп-слова выкидывались, все остальные приводились к нормальной форме.

Результаты поэтического поиска и порадовали, и позабавили. Например, на запрос «музыка» был выдан следующий poem-list:

[('оксане нравилось фламенко'
'олегу классика и джаз'
'они вдвоём со сцены пели'
'про лагеря и мусоров',
0.25434666007036322),
('зашлась в оргазме пианистка'
'в тумане ноты и рояль'
'а ей играть ещё фермату'
'пятнадцать тактов и финал',
0.19876923472322899),
('люблю тебя как шум прибоя'
'как тёплый ветер как стихи'
'а толика люблю как танцы'
'как поцелуи как поспать',
0.19102709737990775),
('мне снится рокот космодрома'
'и ледяная синева'
'но я не тычу это людям'
'об этом песен не пою',
0.15292901301609391),
('индийский танец зита гите'
'танцует страстно у костра'
'но не отбрасывает тени'
'сестра',
0.14688091047781876)]

(цифры в скобках - показатель "сродства")

Здесь примечательно, что слова «музыка» нет ни в одном пирожке, из занесённых в базу. Однако все пирожковые ассоциации весьма музыкальны и степень их семантической диффузии с запросом довольно высока..."


Поиграть онлайн с калькулятором семантической близости: http://ling.go.mail.ru/dsm/ru/similar

(Холера и холерик далеки в "косинусной мере", гораздо дальше, чем напр. "холера" и "зараза".


Занятно, хоть и малопонятно. Чем нам всем это грозит?
А вот чем: Хабр

У гугло-яндексов все больше инструментов по борьбе с контент-фермами.
Т.е. липовыми сайтами и фиктивными блогами, наполняемыми для галочки. Чем наполняемыми?
А жеванным-пережеванным контентом в основном. Орды "рерайтеров" переиначивают тексты,
заменяя выражения синонимами. Все лучше справляются с этим и скрипты.
А с другой стороны - все ближе программная возможность выявлять перелицованные страницы
монетизаторов, забивающих поисковую выдачу пустопорожними ресурсами.

Ну и другие не менее полезные задачи по интеллектуальному поиску "на повестке дня".
Здорово будет, когда Гугл научится т не просто заданную фразу находить в текстах,
а ответ на вопрос, по смыслу, даже если несколько другими словами.

Математическая лингвистика, такая вроде бы оторванная от жизни отвлеченная теория,
сделалась прикладной дисциплиной из самых актуальных.



На закуску: Корпус малых поэтических форм - http://poetory.ru/
Tags: вали_кулем_там_разберем, рисовалки, сХабра, сфейсбученное
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 41 comments
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →