This is a cache of https://github.com/codelibs/fess-testdata. It is a snapshot of the page at 2019-03-25T00:00:43.311+0000.
GitHub - codelibs/fess-testdata: Test Data Repository for Crawling/Parsing
Skip to content
Test Data Repository for Crawling/Parsing
Branch: master
Clone or download
Latest commit a3a3c45 Mar 24, 2019
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
archive
authentication add test Jun 28, 2018
autocad upload AutoCAD testdata Sep 23, 2016
docuworks docuworks 8 testdata Nov 11, 2016
html
ichitaro
ldap
msoffice
mysql add test Jun 28, 2018
other add old style chars Jun 25, 2015
pdf
samba
source_code
text
tools add script for geo May 15, 2016
xml
README.md

README.md

検索システム用テストデータリポジトリ

概要

検索システムがクロールおよびインデックスされるかどうかを検証するデータを集めたリポジトリです。 検証したいファイルがあれば、プルリクエストしてください。

ファイルの作成方法

ファイル

「test」の接頭詞を付加して、適切な拡張子を付けてください。

ファイルの内容

ファイルのコンテンツ部分に「Lorem ipsum. (ロレム・イプサム) 吾輩は猫である。」を記述してください。 メタデータのような場所にはこの文を記述しないでください(抽出箇所がわからなくなるため)。

ディレクトリ

ファイルは適切なディレクトリを作成して置いてください。

ファイル一覧

種類 場所
テキスト text/test_utf8.txt
XML xml/test_utf8.xml
XML xml/test.mm
XML xml/test_sjis.xml
XML xml/test_entity.xml
HTML html/test_hankaku.html
HTML html/test.html
HTML html/test_utf8.html
HTML html/test_sjis.html
HTML html/test_nocharset.html
MS Office msoffice/test.ppt
MS Office msoffice/test.doc
MS Office msoffice/test.pptx
MS Office msoffice/test.xls
MS Office msoffice/test.xlsx
MS Office msoffice/test.docx
PDF pdf/test.pdf
ソースコード source_code/test.js
ソースコード source_code/test.c
ソースコード source_code/test.h
ソースコード source_code/test.java
ソースコード source_code/test.hpp
ソースコード source_code/test.cpp
圧縮ファイル archive/test.tar.gz
圧縮ファイル archive/test.tar
圧縮ファイル archive/test.zip

その他

種類 場所
旧字体 other/old_style.txt
You can’t perform that action at this time.