This is a cache of https://github.com/codelibs/fess-testdata. It is a snapshot of the page at 2021-09-12T00:00:37.172+0000.
GitHub - codelibs/fess-<strong>test</strong>data: <strong>test</strong> Data Repository for Crawling/Parsing
Skip to content
master
Switch branches/tags
Code

Latest commit

 

Git stats

Files

Permalink
Failed to load latest commit information.
Type
Name
Latest commit message
Commit time
ai
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
pdf
 
 
 
 
 
 
 
 
xml
 
 
 
 

検索システム用テストデータリポジトリ

概要

検索システムがクロールおよびインデックスされるかどうかを検証するデータを集めたリポジトリです。 検証したいファイルがあれば、プルリクエストしてください。

ファイルの作成方法

ファイル名

test」の接頭詞を付加して、適切な拡張子を付けてください。

ファイルの内容

ファイルのコンテンツ部分に「Lorem ipsum. (ロレム・イプサム) 吾輩は猫である。」を記述してください。 メタデータのような場所にはこの文を記述しないでください(抽出箇所がわからなくなるため)。

ディレクトリ

ファイルは適切なディレクトリを作成して置いてください。

ファイル一覧

種類 場所
テキスト text/test_utf8.txt
XML xml/test_utf8.xml
XML xml/test.mm
XML xml/test_sjis.xml
XML xml/test_entity.xml
HTML html/test_hankaku.html
HTML html/test.html
HTML html/test_utf8.html
HTML html/test_sjis.html
HTML html/test_nocharset.html
MS Office msoffice/test.ppt
MS Office msoffice/test.doc
MS Office msoffice/test.pptx
MS Office msoffice/test.xls
MS Office msoffice/test.xlsx
MS Office msoffice/test.docx
PDF pdf/test.pdf
ソースコード source_code/test.js
ソースコード source_code/test.c
ソースコード source_code/test.h
ソースコード source_code/test.java
ソースコード source_code/test.hpp
ソースコード source_code/test.cpp
圧縮ファイル archive/test.tar.gz
圧縮ファイル archive/test.tar
圧縮ファイル archive/test.zip

その他

種類 場所
旧字体 other/old_style.txt

About

test Data Repository for Crawling/Parsing

Resources

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •