検索システムのこと熟知してる人いる??

■ このスレッドは過去ログ倉庫に格納されています
0001以下、5ちゃんねるからVIPがお送りします2024/02/19(月) 13:48:19.863ID:8p5UcYzf0
AVのプレステージ系の型番で例えば345SIMM-123って作品で
SIMMの前の数字がないと検索してもヒットしない時あるのなんで??

0002以下、5ちゃんねるからVIPがお送りします2024/02/19(月) 13:49:30.643ID:wsKDbACO0
検索って内部で索引付けてやってるから一部分だけだと引っかからないことあるよ

0003以下、5ちゃんねるからVIPがお送りします2024/02/19(月) 13:50:27.689ID:8p5UcYzf0
索引付けてやる??
なんでそれより多い文字数じゃないとヒットしないのがよくわからん

0004以下、5ちゃんねるからVIPがお送りします2024/02/19(月) 13:52:19.157ID:RIIaXcx70
そりゃあ全文マッチしかしてないからだろう

0005以下、5ちゃんねるからVIPがお送りします2024/02/19(月) 13:52:28.595ID:wsKDbACO0
全部のテキストを前から順に探してくと時間かかるじゃん?
だから単語ごとに区切って処理してんのよ

0006以下、5ちゃんねるからVIPがお送りします2024/02/19(月) 13:53:28.823ID:RIIaXcx70
ちなみに>>1
文字列検索についてどのくらい知ってるん?

>>1の考える熟知を100とすると

0007以下、5ちゃんねるからVIPがお送りします2024/02/19(月) 13:53:42.008ID:8p5UcYzf0
>>5
んーつまりは最初の単語が合った方がヒットしやすいってこと?

0008以下、5ちゃんねるからVIPがお送りします2024/02/19(月) 13:54:07.556ID:NYt17Nos0
「このキーワードのデータはこの辺の番地にある」みたいな索引がデータベースについてる
これは完全一致や前方一致には有効

ただし部分一致や後方一致で探したいときは無効なので、そのときはデータ全検索になってしまう
そうなると応答時間が長くなるため、システムでそれを認めてない場合がある

……とか>>2は言いたいと思う

0009以下、5ちゃんねるからVIPがお送りします2024/02/19(月) 13:54:08.624ID:8p5UcYzf0
>>6
ごめん使うだけだからゼロでいい

0010以下、5ちゃんねるからVIPがお送りします2024/02/19(月) 13:54:51.671ID:8p5UcYzf0
>>8
あー認めてないとかもあんのか

0011以下、5ちゃんねるからVIPがお送りします2024/02/19(月) 13:55:25.453ID:wsKDbACO0
>>8
お前頭いいな

0012以下、5ちゃんねるからVIPがお送りします2024/02/19(月) 13:57:47.533ID:8p5UcYzf0
>>11
おれがヒットさせたんだ

■ このスレッドは過去ログ倉庫に格納されています