情報検索 :検索エンジンの実装と評価 ダウンロード

Isbn 10: 4627817614

Isbn 13: 978-4627817616

ダウンロード 情報検索 :検索エンジンの実装と評価 pdf 本

から

フォーマットを選択:

フォーマットを選択:

zip 10.5 Mb ダウンロード
rar 9.6 Mb ダウンロード
pdf 10.6 Mb ダウンロード
mobi 7.8 Mb ダウンロード
fb2 10.7 Mb ダウンロード
epub 6.4 Mb ダウンロード

本の説明

検索エンジンの根幹をなす技術について、Googleのエンジニアたちが包括的に解説。理論やアルゴリズムだけでなく、手法が実際にどのようなパフォーマンスを示すのかについても詳細に説明する。また、Web検索、並列検索、XML検索といった特定用途の検索についても、それぞれ章を割いて解説。研究者・エンジニアの貴重なリファレンス。【目次】Part 1基礎 1イントロダクション 1.1情報検索とは 1.2情報検索システム 1.3電子テキストの取扱い 1.4テストコレクション 1.5オープンソースIRシステム 1.6さらに学習を進めるために 1.7演習問題 1.8参考文献 2基本技術 2.1転置インデックス 2.2検索とランキング 2.3評価 2.4まとめ 2.5さらに学習を進めるために 2.6演習問題 2.7参考文献 3トークンとターム 3.1英語 3.2文字エンコーディング 3.3Nグラム法 3.4その他のヨーロッパ言語 3.5CJK言語 3.6さらに学習を進めるために 3.7演習問題 3.8参考文献 Part 2インデクシング 4静的転置インデックス 4.1インデックスの構成要素とライフサイクル 4.2辞書 4.3ポスティングリス 4.4インターリービング辞書とポスティングリスト 4.5インデックスの作成 4.6その他のインデックス形式 4.7まとめ 4.8さらに学習を進めるために 4.9演習問題 4.10参考文献 5クエリ処理 5.1ランキングのためのクエリ処理 5.2軽快な実装 5.3さらに学習を進めるために 5.4演習問題 5.5参考文献 6インデックス圧縮 6.1データ圧縮概論 6.2シンボル的データ圧縮 6.3ポスティングリストの圧縮 6.4辞書の圧縮 6.5まとめ 6.6さらに学習を進めるために 6.7演習問題 6.8参考文献 7動的転置インデックス 7.1バッチの更新 7.2増分インデックスの更新 7.3ドキュメントの削除 7.4ドキュメントの変更 7.5さらに学習を進めるために 7.6演習問題 7.7参考文献 Part 3検索とランキング 8確率的情報検索 8.1関連性のモデル化 8.2バイナリ独立モデル 8.3ロバートソン/スパルク・ジョーンズ重み付け関数 8.4ターム頻度 8.5ドキュメントの長さ: BM25 8.6適合性フィードバック 8.7ドキュメント内フィールドによる重み付け: BM25F 8.8実験による比較 8.9さらに学習を進めるために 8.10演習問題 8.11参考文献 9言語モデルと関連分野 9.1ドキュメントからのクエリ生成 9.2言語モデルと平滑化 9.3言語モデルによるランキング 9.4カルバック–ライブラー情報量 9.5ランダム性からの距離 9.6パッセージ検索とランキング 9.7実験による比較 9.8さらに学習を進めるために 9.9演習問題 9.10参考文献 10分類とフィルタ 10.1詳細例 10.2格付け 10.3確率的格付け器 10.4線形格付け器 10.5類似性に基づいた格付け器 10.6一般化線形モデル 10.7情報理論的モデル 10.8実験による比較 10.9さらに学習を進めるために 10.10演習問題 10.11参考文献 11融合・メタ機械学習 11.1検索結果の融合 11.2スタッキング適応フィルタ 11.3バッチ格付け器のスタッキング 11.4バギング 11.5ブースティング 11.6複数カテゴリのランキングと格付け 11.7ランキング学習 11.8さらに学習を進めるために 11.9演習問題 11.10参考文献 Part 4評価 12有効性の評価 12.1伝統的な有効性評価 12.2テキスト検索会議(TREC) 12.3統計指標を用いた評価 12.4判断処理数の最小化 12.5新しい有効性評価 12.6さらに学習を進めるために 12.7演習問題 12.8参考文献 13効率の評価 13.1効率の基準 13.2待ち行列理論 13.3クエリスケジューリング 13.4キャッシング 13.5さらに学習を進めるために 13.6演習問題 13.7参考文献 Part 5大規模情報検索システムの構築方法 14並列情報検索 14.1並列クエリ処理 14.2マップレデュース 14.3さらに学習を進めるために 14.4演習問題 14.5参考文献 15Web検索 15.1Webの構造 15.2クエリとユーザ 15.3静的ランキング 15.4動的ランキング 15.5Web検索の評価 15.6Webクローラ 15.7まとめ 15.8さらに学習を進めるために 15.9演習問題 15.10参考文献 16XML検索 16.1XMLのエッセンス 16.2パス,ツリー,フラワー 16.3インデクシングとクエリ処 16.4ランキング検索 16.5評価 16.6さらに学習を進めるために 16.7演習問題 16.8参考文献 Part 6付録Aコンピュータの性能 A.1ディスクのシーケンシャルアクセスとランダムアクセス A.2メモリのシーケンシャルアクセスとランダムアクセ 2A.3パイプライン処理と分岐予測 訳者あとがき 索引

著者 :梅澤 克之 Neil Rubens 松田 健 三川 健太 水野 信也 山本 健司
Isbn 10 :4627817614
Isbn 13 :978-4627817616
によって公開 :2020/10/30
ページ数 :720ページ
出版社 情報検索 :検索エンジンの実装と評価:森北出版