Documentation Index
Fetch the complete documentation index at: https://dify-6c0370d8-docs-sync-pr-768.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
⚠️ このドキュメントは AI によって自動翻訳されています。不正確な部分がある場合は、英語版 を参照してください。
Jina ReaderやFirecrawlは、オープンソースのウェブページ解析ツールです。ウェブページをクリーンで大規模言語モデル(LLM)が扱いやすいMarkdown形式のテキストに変換します。また、使いやすいAPIサービスも提供しています。
Firecrawl
Firecrawlの認証情報の設定
右上隅にあるアバターをクリックし、DataSourceページでFirecrawlの認証情報を設定する必要があります。

Firecrawl を使用してWebコンテンツをクロールする
ナレッジベース作成のページでSync from websiteを選択し、スクレイピングの対象どしてのウェブページのURLを入力します。 設定項目には、サブページのスクレイピング、スクレイピングするページの上限、ページのスクレイピング深度、ページの除外、指定ページのみのスクレイピング、コンテンツの抽出などが含まれます。設定が完了したら Run をクリックし、解析結果のページをプレビューします。
Jina Reader
Jina Readerの認証情報の設定
右上隅にあるアバターをクリックし、DataSourceページでJina Readerの認証情報を設定する必要があります。

Jina Reader を使用してWebコンテンツをクロールする
ナレッジベース作成のページでSync from websiteを選択し、スクレイピングの対象どしてのウェブページのURLを入力します。

