Программируем коллективный разум [Тоби Сегаран] (pdf) читать постранично

Книга в формате pdf! Изображения и текст могут не отображаться!


 [Настройки текста]  [Cбросить фильтры]

Programming
Collective Intelligence

Toby Segaran

Программируем
коллективный разум

Тоби Сегаран

Тоби Сегаран

Программируем коллективный разум
Перевод А. Слинкина
Главный редактор
Выпускающий редактор
Редактор
Научный редактор
Корректор
Верстка

А. Галунов
Л. Пискунова
Е. Тульсанова
С. Миронов
Е. Бекназарова
Д. Белова

Сегаран. Т.
Программируем коллективный разум. – Пер. с англ. – СПб: Символ-Плюс,
2008. – 368 с., ил.
ISBN13: 978-5-93286-119-6
ISBN10: 5-93286-119-3
Средства эффективной обработки информации в Интернете еще никогда не были настолько важны и востребованы, как сегодня. Эта книга – первое практическое руководство по программированию интеллектуальных приложений
для Web 2.0. Здесь вы найдете все необходимое, чтобы научиться создавать самообучаемые программы, которые способны собирать и анализировать огромные массивы данных, имеющиеся в Сети. Вы научитесь пользоваться алгоритмами машинного обучения, адаптируя их под свои собственные нужды. Чтобы
овладеть представленным материалом, от вас не потребуется никаких специальных знаний об анализе данных, машинном обучении или математической
статистике. Однако предполагается, что вы имеете достаточный опыт программирования и знакомы с основными концепциями. В каждой главе вы найдете
практические примеры и задания, которые помогут вам быстро и легко освоить различные аспекты работы алгоритмов.
ISB­13: 978-5-93286-119-6
ISB­10: 5-93286-119-3
ISB­ 0-596-52932-5 (англ)
© Издательство Символ-Плюс, 2008
© Symbol Plus, 2008
Authorized translation of the English edition of Programming Collective Intelligence
© 2007 O’Reilly Media Inc. This translation is published and sold by permission of
O’Reilly Media Inc., the owner of all rights to publish and sell the same.
Все права на данное издание защищены Законодательством РФ, включая право на полное или частичное воспроизведение в любой форме. Все товарные знаки или зарегистрированные товарные знаки,
упоминаемые в настоящем издании, являются собственностью соответствующих фирм.

Издательство «Символ-Плюс». 199034, Санкт-Петербург, 16 линия, 7,
тел. (812) 3245353, www.symbol.ru. Лицензия ЛП N 000054 от 25.12.98.
Налоговая льгота – общероссийский классификатор продукции
ОК 005 93, том 2; 953000 - книги и брошюры.
Подписано в печать 30.06.2008. Формат 70х100 1/16. Печать офсетная.
Объем 23 печ. л. Тираж 2000 экз. Заказ N
Отпечатано с готовых диапозитивов в ГУП «Типография «Наука»
199034, Санкт-Петербург, 9 линия, 12.

Оглавление
Предисловие ...............................................................................9
Введение .................................................................................. 10
Благодарности ........................................................................... 18

1. Введение в коллективный разум ........................................... 19
Что такое коллективный разум .................................................... 20
Что такое машинное обучение ..................................................... 22
Ограничения машинного обучения ............................................... 23
Примеры из реальной жизни ....................................................... 23
Другие применения обучающих алгоритмов .................................. 24

2. Выработка рекомендаций ..................................................... 26
Коллаборативная фильтрация ..................................................... 27
Сбор информации о предпочтениях .............................................. 27
Отыскание похожих пользователей .............................................. 29
Рекомендование предметов ......................................................... 35
Подбор предметов ...................................................................... 37
Построение рекомендателя ссылок с помощью API сайта del.icio.us ... 39
Фильтрация по схожести образцов ............................................... 43
Использование набора данных MovieLens ...................................... 46
Сравнение методов фильтрации по схожести пользователей
и по схожести образцов ............................................................... 48
Упражнения ............................................................................. 49

3. Обнаружение групп ............................................................... 50
Обучение с учителем и без него .................................................... 51
Векторы слов............................................................................. 51
Иерархическая кластеризация .................................................... 54
Рисование дендрограммы ............................................................ 60
Кластеризация столбцов ............................................................. 63

6

Оглавление
Кластеризация методом K-средних............................................... 64
Кластеры предпочтений .............................................................. 67
Просмотр данных на двумерной плоскости .................................... 71
Что еще можно подвергнуть кластеризации ................................... 75
Упражнения ............................................................................. 76

4. Поиск и ранжирование........................................................... 77
Что такое поисковая машина ....................................................... 77
Простой паук ............................................................................ 79
Построение индекса ................................................................... 82
Запросы.................................................................................... 86
Ранжирование по содержимому ................................................... 88
Использование внешних ссылок на сайт ........................................ 93
Обучение на основе действий пользователя .................................... 99
Упражнения ........................................................................... 109

5. Оптимизация