クロール方針
robots.txt と各サイトの利用条件を尊重し、同一ホストへのアクセス間隔を空けます。User-Agent にはサービス名、URL、連絡先を含めます。
保存と抽出
取得原本はサイズキャップし、R2へ attachment として圧縮保存します。LLMまたはルール抽出には、AIキーワード周辺の短い本文だけを渡します。
抽出しない情報
個人名、担当者名、創業者名、求人担当名、メールアドレス、電話番号、AI以外の企業評価は抽出・保存しません。
順位
順位は公開情報と口コミから自動算出します。掲載企業からの支払い、広告、claimで順位が変わることはありません。