org.apache.lucene.analysis.synonym.SolrSynonymParser源码实例Demo-星河码客

类org.apache.lucene.analysis.synonym.SolrSynonymParser源码实例Demo

下面列出了怎么用org.apache.lucene.analysis.synonym.SolrSynonymParser的API类实例代码及写法，或者点击链接到github查看源代码。

源代码1 项目： lucene-solr 文件： TestConditionalTokenFilter.java

public void testWrapGraphs() throws Exception {

    TokenStream stream = whitespaceMockTokenizer("a b c d e");

    SynonymMap sm;
    try (Analyzer analyzer = new MockAnalyzer(random())) {
      SolrSynonymParser parser = new SolrSynonymParser(true, true, analyzer);
      parser.parse(new StringReader("a b, f\nc d, g"));
      sm = parser.build();
    }

    TokenStream ts = new SkipMatchingFilter(stream, in -> new SynonymGraphFilter(in, sm, true), "c");

    assertTokenStreamContents(ts, new String[]{
        "f", "a", "b", "c", "d", "e"
        },
        null, null, null,
        new int[]{
        1, 0, 1, 1, 1, 1
        },
        new int[]{
        2, 1, 1, 1, 1, 1
        });

  }

源代码2 项目： query-autofiltering-component 文件： QueryAutoFilteringComponent.java

@Override
public void inform( SolrCore core ) {
  if (initParams != null) {
    SolrResourceLoader resourceLoader = core.getResourceLoader( );
      
    synonymsFile = (String)initParams.get( "synonyms" );
    if (synonymsFile != null) {
      Analyzer analyzer = new Analyzer() {
      @Override
        protected TokenStreamComponents createComponents(String fieldName) {
          Tokenizer tokenizer = new KeywordTokenizer();
          return new TokenStreamComponents(tokenizer, tokenizer );
        }
      };
              
      try {
        SolrSynonymParser parser = new SolrSynonymParser(true, true, analyzer);
        CharsetDecoder decoder = StandardCharsets.UTF_8.newDecoder().onMalformedInput(CodingErrorAction.REPORT)
                                                                    .onUnmappableCharacter(CodingErrorAction.REPORT);
                  
        parser.parse(new InputStreamReader( resourceLoader.openResource(synonymsFile), decoder));
        this.synonyms = parser.build( );
      }
      catch ( Exception e ) {
        // ???
        Log.warn( "Parsing Synonyms Got Exception " + e );
      }
    }
      
    String stopwordsFile = (String)initParams.get( "stopwords" );
    if (stopwordsFile != null) {
      this.stopwords = new HashSet<String>( );
      try {
        BufferedReader br = new BufferedReader( new InputStreamReader( resourceLoader.openResource( stopwordsFile )));
        String line = null;
        while ((line = br.readLine( )) != null) {
          stopwords.add( line.toLowerCase( ) );
        }
        br.close( );
      }
      catch ( IOException ioe ) {
        Log.warn( "Adding Stopwords Got Exception " + ioe );
      }
    }
  }
    
  core.registerFirstSearcherListener( this );
  core.registerNewSearcherListener( this );
}

源代码3 项目： query-autofiltering-component 文件： QueryAutoFilteringComponent.java

@Override
public void inform( SolrCore core ) {
  if (initParams != null) {
    SolrResourceLoader resourceLoader = core.getResourceLoader( );
      
    synonymsFile = (String)initParams.get( "synonyms" );
    if (synonymsFile != null) {
      Analyzer analyzer = new Analyzer() {
      @Override
        protected TokenStreamComponents createComponents(String fieldName, Reader reader) {
          Tokenizer tokenizer = new KeywordTokenizer( reader );
          return new TokenStreamComponents(tokenizer, tokenizer );
        }
      };
              
      try {
        SolrSynonymParser parser = new SolrSynonymParser(true, true, analyzer);
        CharsetDecoder decoder = StandardCharsets.UTF_8.newDecoder().onMalformedInput(CodingErrorAction.REPORT)
                                                                    .onUnmappableCharacter(CodingErrorAction.REPORT);
                  
        parser.parse(new InputStreamReader( resourceLoader.openResource(synonymsFile), decoder));
        this.synonyms = parser.build( );
      }
      catch ( Exception e ) {
        // ???
        Log.warn( "Parsing Synonyms Got Exception " + e );
      }
    }
      
    String stopwordsFile = (String)initParams.get( "stopwords" );
    if (stopwordsFile != null) {
      this.stopwords = new HashSet<String>( );
      try {
        BufferedReader br = new BufferedReader( new InputStreamReader( resourceLoader.openResource( stopwordsFile )));
        String line = null;
        while ((line = br.readLine( )) != null) {
          stopwords.add( line.toLowerCase( ) );
        }
        br.close( );
      }
      catch ( IOException ioe ) {
        Log.warn( "Adding Stopwords Got Exception " + ioe );
      }
    }
  }
    
  core.registerFirstSearcherListener( this );
  core.registerNewSearcherListener( this );
}

类所在包

org.apache.lucene.analysis

类方法

同包方法

org.apache.lucene.analysis.Analyzer

org.apache.lucene.analysis.TokenStream

org.apache.lucene.analysis.standard.StandardAnalyzer

org.apache.lucene.analysis.tokenattributes.CharTermAttribute

org.apache.lucene.analysis.Tokenizer

org.apache.lucene.analysis.tokenattributes.OffsetAttribute

org.apache.lucene.analysis.tokenattributes.PositionIncrementAttribute

org.apache.lucene.analysis.tokenattributes.TypeAttribute

org.apache.lucene.analysis.TokenFilter

org.apache.lucene.analysis.standard.StandardTokenizer

org.apache.lucene.analysis.core.WhitespaceAnalyzer

org.apache.lucene.analysis.core.WhitespaceTokenizer

org.apache.lucene.analysis.util.TokenizerFactory

org.apache.lucene.analysis.core.LowerCaseFilter

org.apache.lucene.analysis.LowerCaseFilter

org.apache.lucene.analysis.core.StopFilter

org.apache.lucene.analysis.core.KeywordAnalyzer

org.apache.lucene.analysis.util.TokenFilterFactory

org.apache.lucene.analysis.core.StopAnalyzer

org.apache.lucene.analysis.en.EnglishAnalyzer

org.apache.lucene.analysis.core.SimpleAnalyzer

org.apache.lucene.analysis.standard.StandardFilter

org.apache.lucene.analysis.CharArraySet

org.apache.lucene.analysis.miscellaneous.PerFieldAnalyzerWrapper

org.apache.lucene.analysis.util.ResourceLoader

org.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer

org.apache.lucene.analysis.cjk.CJKAnalyzer

org.apache.lucene.analysis.util.CharArraySet

org.apache.lucene.analysis.miscellaneous.ASCIIFoldingFilter

org.apache.lucene.analysis.custom.CustomAnalyzer

org.apache.lucene.analysis.util.ResourceLoaderAware

org.apache.lucene.analysis.core.KeywordTokenizer

org.apache.lucene.analysis.Token

org.apache.lucene.analysis.tokenattributes.TermToBytesRefAttribute

org.apache.lucene.analysis.core.LowerCaseFilterFactory

org.apache.lucene.analysis.en.PorterStemFilter

org.apache.lucene.analysis.fr.FrenchAnalyzer

org.apache.lucene.analysis.shingle.ShingleFilter

org.apache.lucene.analysis.StopFilter

org.apache.lucene.analysis.synonym.SynonymMap

org.apache.lucene.analysis.tokenattributes.PositionLengthAttribute

org.apache.lucene.analysis.de.GermanAnalyzer

org.apache.lucene.analysis.snowball.SnowballFilter

org.apache.lucene.analysis.nl.DutchAnalyzer

org.apache.lucene.analysis.BaseTokenStreamTestCase

org.apache.lucene.analysis.ngram.NGramTokenFilter

org.apache.lucene.analysis.standard.StandardTokenizerFactory

org.apache.lucene.analysis.synonym.SolrSynonymParser

org.apache.lucene.analysis.ru.RussianAnalyzer

org.apache.lucene.analysis.core.KeywordTokenizerFactory

org.apache.lucene.analysis.WhitespaceAnalyzer

org.apache.lucene.analysis.tokenattributes.PayloadAttribute

org.apache.lucene.analysis.payloads.PayloadHelper

org.apache.lucene.analysis.ngram.NGramTokenizer

org.apache.lucene.analysis.tokenattributes.KeywordAttribute

org.apache.lucene.analysis.CachingTokenFilter

org.apache.lucene.analysis.CharTokenizer

org.apache.lucene.analysis.standard.ClassicFilter

org.apache.lucene.analysis.miscellaneous.WordDelimiterGraphFilter

org.apache.lucene.analysis.tokenattributes.PackedTokenAttributeImpl

org.apache.lucene.analysis.es.SpanishAnalyzer

org.apache.lucene.analysis.miscellaneous.SetKeywordMarkerFilter

org.apache.lucene.analysis.br.BrazilianAnalyzer

org.apache.lucene.analysis.AnalyzerWrapper

org.apache.lucene.analysis.util.CharFilterFactory

org.apache.lucene.analysis.it.ItalianAnalyzer

org.apache.lucene.analysis.util.StopwordAnalyzerBase

org.apache.lucene.analysis.cz.CzechAnalyzer

org.apache.lucene.analysis.core.StopFilterFactory

org.apache.lucene.analysis.standard.ClassicAnalyzer

org.apache.lucene.analysis.synonym.SynonymFilter

org.apache.lucene.analysis.tokenattributes.TermAttribute

org.apache.lucene.analysis.pt.PortugueseAnalyzer

org.apache.lucene.analysis.miscellaneous.LengthFilter

org.apache.lucene.analysis.el.GreekAnalyzer

org.apache.lucene.analysis.charfilter.HTMLStripCharFilter

org.apache.lucene.analysis.WordlistLoader

org.apache.lucene.analysis.CharArrayMap

org.apache.lucene.analysis.core.TypeTokenFilter

org.apache.lucene.analysis.ar.ArabicNormalizationFilter

org.apache.lucene.analysis.path.PathHierarchyTokenizer

org.apache.lucene.analysis.Analyzer.TokenStreamComponents

org.apache.lucene.analysis.standard.ClassicTokenizer

org.apache.lucene.analysis.synonym.WordnetSynonymParser

org.apache.lucene.analysis.pattern.PatternReplaceFilter

org.apache.lucene.analysis.util.ElisionFilter

org.apache.lucene.analysis.path.ReversePathHierarchyTokenizer

org.apache.lucene.analysis.de.GermanNormalizationFilter

org.apache.lucene.analysis.no.NorwegianAnalyzer

org.apache.lucene.analysis.MockTokenizer

org.apache.lucene.analysis.fi.FinnishAnalyzer

org.apache.lucene.analysis.util.CharTokenizer

org.apache.lucene.analysis.pattern.PatternTokenizer

org.apache.lucene.analysis.sv.SwedishAnalyzer

org.apache.lucene.analysis.tr.TurkishAnalyzer

org.apache.lucene.analysis.ngram.EdgeNGramTokenFilter

org.apache.lucene.analysis.StopwordAnalyzerBase

org.apache.lucene.analysis.cjk.CJKBigramFilter

org.apache.lucene.analysis.en.EnglishPossessiveFilter

org.apache.lucene.analysis.util.ClasspathResourceLoader

org.apache.lucene.analysis.th.ThaiAnalyzer

org.apache.lucene.analysis.CharFilter

org.apache.lucene.analysis.DelegatingAnalyzerWrapper

org.apache.lucene.analysis.miscellaneous.WordDelimiterFilterFactory

org.apache.lucene.analysis.miscellaneous.ASCIIFoldingFilterFactory

org.apache.lucene.analysis.synonym.SynonymGraphFilter

org.apache.lucene.analysis.in.IndicNormalizationFilter

org.apache.lucene.analysis.da.DanishAnalyzer

org.apache.lucene.analysis.en.EnglishMinimalStemFilter

org.apache.lucene.analysis.ca.CatalanAnalyzer

org.apache.lucene.analysis.CharacterUtils

org.apache.lucene.analysis.PerFieldAnalyzerWrapper

org.apache.lucene.analysis.eu.BasqueAnalyzer

org.apache.lucene.analysis.core.LetterTokenizer

org.apache.lucene.analysis.payloads.PayloadEncoder

org.apache.lucene.analysis.commongrams.CommonGramsFilter

org.apache.lucene.analysis.bg.BulgarianAnalyzer

org.apache.lucene.analysis.miscellaneous.WordDelimiterIterator

org.apache.lucene.analysis.hy.ArmenianAnalyzer

org.apache.lucene.analysis.ar.ArabicStemFilter

org.apache.lucene.analysis.miscellaneous.WordDelimiterFilter

org.apache.lucene.analysis.pattern.PatternReplaceFilterFactory

org.apache.lucene.analysis.fa.PersianAnalyzer

org.apache.lucene.analysis.reverse.ReverseStringFilter

org.apache.lucene.analysis.ngram.EdgeNGramTokenizer

org.apache.lucene.analysis.de.GermanLightStemFilter

org.apache.lucene.analysis.util.AbstractAnalysisFactory

org.apache.lucene.analysis.ga.IrishAnalyzer

org.apache.lucene.analysis.en.KStemFilter

org.apache.lucene.analysis.tr.TurkishLowerCaseFilter

org.apache.lucene.analysis.hi.HindiAnalyzer

org.apache.lucene.analysis.miscellaneous.StemmerOverrideFilter

org.apache.lucene.analysis.miscellaneous.LimitTokenCountFilter

org.apache.lucene.analysis.id.IndonesianAnalyzer

org.apache.lucene.analysis.th.ThaiTokenizer

org.apache.lucene.analysis.miscellaneous.StemmerOverrideFilter.StemmerOverrideMap

org.apache.lucene.analysis.ar.ArabicAnalyzer

org.apache.lucene.analysis.StopAnalyzer

org.apache.lucene.analysis.pattern.PatternReplaceCharFilter

org.apache.lucene.analysis.hi.HindiStemFilter

org.apache.lucene.analysis.ckb.SoraniAnalyzer

org.apache.lucene.analysis.standard.UAX29URLEmailTokenizer

org.apache.lucene.analysis.charfilter.BaseCharFilter

org.apache.lucene.analysis.wikipedia.WikipediaTokenizer

org.apache.lucene.analysis.miscellaneous.TrimFilter

org.apache.lucene.analysis.compound.hyphenation.HyphenationTree

org.apache.lucene.analysis.charfilter.NormalizeCharMap

org.apache.lucene.analysis.fa.PersianNormalizationFilter

org.apache.lucene.analysis.gl.GalicianAnalyzer

org.apache.lucene.analysis.hi.HindiNormalizationFilter

org.apache.lucene.analysis.ro.RomanianAnalyzer

org.apache.lucene.analysis.core.WhitespaceTokenizerFactory

org.apache.lucene.analysis.core.UpperCaseFilter

org.apache.lucene.analysis.core.DecimalDigitFilter

org.apache.lucene.analysis.it.ItalianLightStemFilter

org.apache.lucene.analysis.KeywordAnalyzer

org.apache.lucene.analysis.de.GermanStemFilter

org.apache.lucene.analysis.lv.LatvianAnalyzer

org.apache.lucene.analysis.WhitespaceTokenizer

org.apache.lucene.analysis.hu.HungarianAnalyzer

org.apache.lucene.analysis.cjk.CJKWidthFilter

org.apache.lucene.analysis.core.LowerCaseTokenizer

org.apache.lucene.analysis.cjk.CJKWidthFilterFactory

org.apache.lucene.analysis.compound.HyphenationCompoundWordTokenFilter

org.apache.lucene.analysis.commongrams.CommonGramsQueryFilter

org.apache.lucene.analysis.hunspell.Dictionary

org.apache.lucene.analysis.charfilter.MappingCharFilter

org.apache.lucene.analysis.tokenattributes.CharTermAttributeImpl