検索について理解する
コンテンツ選択されたPercipio言語のみです。コンテンツ提供の詳細を見るために、言語設定を変更することができます。を検索してから、また検索することができます。
検索エンジン
Percipioは、Apache Luceneを基盤とするオープンソース検索エンジンである、Elasticsearchを使用しています。Elasticsearchは、現時点では、最も人気の高いエンタープライズ向け検索エンジンであり、Facebook、Netflix、GitHub、Skillport 8iといったサイトで使われています。Elasticsearchは、先行入力提案、 語幹処理/語形、同義語、そして曖昧一致検索(タイプミス訂正)といった現代の検索エンジンに期待される多数の機能に対応しています。
検索が作用する仕組み
選択したPercipio言語のみでコンテンツの検索を行えます。検索用語を入力すると、検索エンジンは、索引付きのアセットメタデータに合致するものを探します。合致するものが見つかると、関連するスコアが各アセットに対して算定されます。
単一の単語検索用語の場合、Percipioは、単純な単語合致を探します。複数の単語の場合、語句合致も検索します。「正確な完全一致」に対して引用符は不要です。その理由は、複数の単語用語が入力された際に自動的に検索が行われるからです。
検索で使用されるアセットメタデータフィールドには、下記が含まれます。
- アセットとチャンネルタイトル
- アセットとチャンネル説明(概要)
- ブックの著者 / ビデオ講師 / コ-ス指導者の氏名
- ブックの発行者
- ブックのISBN
- 発行者の名称
- コース、ビデオおよびブックのID
- 認定試験の名称と番号
- テクノロジーとバージョン
- コ-スとビデオトランスクリプトおよびブックの全文
先行入力
先行入力では、検索フィールドにタイプ入力するに従い、提案された用語が表示されます。そうした提案内容は、下記の複数のソースから編纂されます。
- 共通する検索用語を纏めたリスト
- 認定試験の名称と番号
- チャンネルとアセットタイトル
提案された用語を選択すると、検索フィールドに入力され、検索が実行されます。
語幹処理 / 語形
語幹処理では、関連する結果が省かれないように、それぞれ異なる単語の形態が探されます。完全に一致する単語/語句の検索に加えて、検索エンジンは、複数の単語をそれらに共通する語形に変換します。例えば、「programming」、「programmer」、「programmed」、「programs」 そして 「program」 の各単語は、すべて一致としてカウントされることになります。
同義語
検索用語がいずれかのアセットメタデータで使用されない場合、一致するものが見つからない場合があります。このため、検索エンジンは、相当するもしくは関連する用語を定義するのに同義語を使用します。
例: Excelのピボットテーブルでコ-スを見つけたい場合。
検索フィールドに「ピボットテーブル(pivot tables)」という用語を入力する。通常、これは合致するものとしてカウントされ得ません。その理由は、検索エンジンが、これら二つの単語を別個のものだとみなし、アセット用メタデータが「pivottable」を使用するからです。ただし、検索機能が同義語を使用するため、「pivot tables」という検索用語は、「pivottable」と同等であるとみなされて、双方の用語は合致するものとなります。
さらに、"accessibility"、"wcag" そして "section 508" といった用語は、関連するものであるとみなされます。アクセシビリティに関するコ-スは、アセットメタデータで「section 508」という用語を使用しないことがありますが、そうした用語の検索では、アクセシビリティに関連するアセット(accessibility-related assets)を返してきます。
「コーチング」と「メンタリング」は、非常に関連性の高いものですが、アセットは、メタデータにおいてそのうちの一つだけを使用するかもしれません。そうした関連する用語を関連付けるのに同義語を使用すると、奏功的な検索が促進されます。
Skillsoftは、定期的に、共通する検索用語履歴を見直しており、さらに
曖昧一致
検索用語と先行入力提案のどちらも、スペルミス/タイプミスを特定するのに曖昧さを使用します。三つの文字を検索ボックスに入力した後、提案(見つかった場合)が、そうした文字に基づいてなされます。
完全一致結果が、当初の検索クエリーに対して見つからない場合、検索エンジンは、曖昧さを該当する用語に適用し、さらに近似する一致を探します。
検索関連性
検索エンジンは、一致するすべてのアセットを対象に関連スコアを算定します。この関連スコアは、下記のいくつかの要因に基づいて算定されます。
- 一致するものが多ければ多いほど、スコアはより高くなる
- 所与のフィールドで複数の単語をマッチングさせると(語句一致)、スコアはより高くなる
- 短いフィールドの一致には、長いフィールドの一致に比べてより高い重みが加えられます(例えば、タイトルにおける一致には、説明における一致に比べてより高い重みが加えられますが、そうした一致には全文における一致に比べてより高い重みが加えられます)。
各一致には、スコアが付けられてから、関連性をきめ細かく調整するにあたり、調整されます。Percipioは、下記の要因に基づいてアセット関連スコアを降順(最大強化度から最低強化度の順)で強化します。
- チャンネルタイトルにおける語句もしくは単語一致
- カスタムコンテンツタイトルにおける語句もしくは単語一致
- ビデオタイトルにおける語句もしくは単語一致
- コ-スタイトルにおける語句もしくは単語一致
- 認定試験における語句もしくは単語一致
- カスタムコンテンツソ-スにおける語句もしくは単語一致
- ブックタイトルにおける語句もしくは単語一致
- 指導者/著者/発表者名の語句もしくは単語一致
- コンテンツIDにおける語句もしくは単語一致
- ペアレントチャンネルタイトルにおける語句もしくは単語一致
- 発行者名における語句もしくは単語一致
- チャイルドタイトル(コ-スのタイトル)における語句もしくは単語一致
- カスタムコンテンツ説明における単語一致
- チャンネル説明(チャンネル関連性)における単語一致
- ブックISBNに対する単語一致
- テクノロジータイトルもしくはバージョンにおける単語一致
- ブックテキストにおける単語一致
- ビデオトランスクリプトにおける単語一致
- 説明における単語一致
一致スコアは、組み合わされて、一致した各アセットに対して最終的な関連スコアを与えます。結果は、関連する降順で表示されます。
高度な機能
検索をできるだけ簡素化するにあたり、完全語句一致用の「引用符付き文字列」、b-ル演算子、ワイルドカード、近似インジケータ類(proximity indicators)は、現時点では、サポートされていません。とは言え、Skillsoftは、学習者がどのように検索を使用しているのかをモニターしており、さらに今後そうした機能向けにさらなるサポートを増強することもありえます。