package org.cnnlp.data.splitter; import org.cnnlp.data.document.GDocument; import org.cnnlp.data.util.BaseParameters; import java.io.IOException; import java.util.List; public interface IMdChunking { // simple/faq/tagged //public static final String MD_TYPE = "mdType"; //输出的是 章节 List splitSimple(String text, BaseParameters params) throws IOException; //输出的是 章节 List splitFaq(String text, BaseParameters params) throws IOException; //输出的是 章节 List split(String text, BaseParameters params) throws IOException; // 输出的是 chunk List chunking(String text, BaseParameters params) throws IOException; }