org.apache.lucene.search.spell.DirectSpellChecker源码实例Demo-星河码客

类org.apache.lucene.search.spell.DirectSpellChecker源码实例Demo

下面列出了怎么用org.apache.lucene.search.spell.DirectSpellChecker的API类实例代码及写法，或者点击链接到github查看源代码。

源代码1 项目： Elasticsearch 文件： TermSuggester.java

@Override
public TermSuggestion innerExecute(String name, TermSuggestionContext suggestion, IndexSearcher searcher, CharsRefBuilder spare) throws IOException {
    DirectSpellChecker directSpellChecker = SuggestUtils.getDirectSpellChecker(suggestion.getDirectSpellCheckerSettings());
    final IndexReader indexReader = searcher.getIndexReader();
    TermSuggestion response = new TermSuggestion(
            name, suggestion.getSize(), suggestion.getDirectSpellCheckerSettings().sort()
    );
    List<Token> tokens = queryTerms(suggestion, spare);
    for (Token token : tokens) {
        // TODO: Extend DirectSpellChecker in 4.1, to get the raw suggested words as BytesRef
        SuggestWord[] suggestedWords = directSpellChecker.suggestSimilar(
                token.term, suggestion.getShardSize(), indexReader, suggestion.getDirectSpellCheckerSettings().suggestMode()
        );
        Text key = new Text(new BytesArray(token.term.bytes()));
        TermSuggestion.Entry resultEntry = new TermSuggestion.Entry(key, token.startOffset, token.endOffset - token.startOffset);
        for (SuggestWord suggestWord : suggestedWords) {
            Text word = new Text(suggestWord.string);
            resultEntry.addOption(new TermSuggestion.Entry.Option(word, suggestWord.freq, suggestWord.score));
        }
        response.addTerm(resultEntry);
    }
    return response;
}

源代码2 项目： Elasticsearch 文件： DirectCandidateGenerator.java

public DirectCandidateGenerator(DirectSpellChecker spellchecker, String field, SuggestMode suggestMode, IndexReader reader, double nonErrorLikelihood,  int numCandidates, Analyzer preFilter, Analyzer postFilter, Terms terms) throws IOException {
    if (terms == null) {
        throw new IllegalArgumentException("generator field [" + field + "] doesn't exist");
    }
    this.spellchecker = spellchecker;
    this.field = field;
    this.numCandidates = numCandidates;
    this.suggestMode = suggestMode;
    this.reader = reader;
    final long dictSize = terms.getSumTotalTermFreq();
    this.useTotalTermFrequency = dictSize != -1;
    this.dictSize =  dictSize == -1 ? reader.maxDoc() : dictSize;
    this.preFilter = preFilter;
    this.postFilter = postFilter;
    this.nonErrorLikelihood = nonErrorLikelihood;
    float thresholdFrequency = spellchecker.getThresholdFrequency();
    this.frequencyPlateau = thresholdFrequency >= 1.0f ? (int) thresholdFrequency: (int)(dictSize * thresholdFrequency);
    termsEnum = terms.iterator();
}

源代码3 项目： preDict 文件： LuceneWordSearch.java

@Override
public void indexingDone() {
	try {
		spellChecker = new DirectSpellChecker();
		spellChecker.setMaxEdits(2);
		spellChecker.setAccuracy(0.1f);
		spellChecker.setMinPrefix(0);
		reader = DirectoryReader.open(writer);

		fuzzySuggester = new FuzzySuggester(directory, "", writer.getAnalyzer());
		Dictionary dict = new DocumentValueSourceDictionary(reader, WORD_FIELD, new LongValuesSource() {
			
			@Override
			public boolean needsScores() {
				return false;
			}
			
			@Override
			public LongValues getValues(LeafReaderContext ctx, DoubleValues scores) throws IOException {
				return null;
			}
		});
		fuzzySuggester.build(dict);
		
		writer.close();
		searcher = new IndexSearcher(DirectoryReader.open(directory));
	} catch (IOException e) {
		throw new RuntimeException(e);
	}
}

源代码4 项目： Elasticsearch 文件： DirectCandidateGenerator.java

public DirectCandidateGenerator(DirectSpellChecker spellchecker, String field, SuggestMode suggestMode, IndexReader reader, double nonErrorLikelihood, int numCandidates) throws IOException {
    this(spellchecker, field, suggestMode, reader,  nonErrorLikelihood, numCandidates, null, null, MultiFields.getTerms(reader, field));
}

源代码5 项目： lucene-solr 文件： DirectSolrSpellChecker.java

@Override
@SuppressWarnings({"unchecked"})
public String init(@SuppressWarnings({"rawtypes"})NamedList config, SolrCore core) {

  SolrParams params = config.toSolrParams();

  log.info("init: {}", config);
  String name = super.init(config, core);
  
  Comparator<SuggestWord> comp = SuggestWordQueue.DEFAULT_COMPARATOR;
  String compClass = (String) config.get(COMPARATOR_CLASS);
  if (compClass != null) {
    if (compClass.equalsIgnoreCase(SCORE_COMP))
      comp = SuggestWordQueue.DEFAULT_COMPARATOR;
    else if (compClass.equalsIgnoreCase(FREQ_COMP))
      comp = new SuggestWordFrequencyComparator();
    else //must be a FQCN
      comp = (Comparator<SuggestWord>) core.getResourceLoader().newInstance(compClass, Comparator.class);
  }
  
  StringDistance sd = DirectSpellChecker.INTERNAL_LEVENSHTEIN;
  String distClass = (String) config.get(STRING_DISTANCE);
  if (distClass != null && !distClass.equalsIgnoreCase(INTERNAL_DISTANCE))
    sd = core.getResourceLoader().newInstance(distClass, StringDistance.class);

  float minAccuracy = DEFAULT_ACCURACY;
  Float accuracy = params.getFloat(ACCURACY);
  if (accuracy != null)
    minAccuracy = accuracy;
  
  int maxEdits = DEFAULT_MAXEDITS;
  Integer edits = params.getInt(MAXEDITS);
  if (edits != null)
    maxEdits = edits;
  
  int minPrefix = DEFAULT_MINPREFIX;
  Integer prefix = params.getInt(MINPREFIX);
  if (prefix != null)
    minPrefix = prefix;
  
  int maxInspections = DEFAULT_MAXINSPECTIONS;
  Integer inspections = params.getInt(MAXINSPECTIONS);
  if (inspections != null)
    maxInspections = inspections;
  
  float minThreshold = DEFAULT_THRESHOLD_TOKEN_FREQUENCY;
  Float threshold = params.getFloat(THRESHOLD_TOKEN_FREQUENCY);
  if (threshold != null)
    minThreshold = threshold;
  
  int minQueryLength = DEFAULT_MINQUERYLENGTH;
  Integer queryLength = params.getInt(MINQUERYLENGTH);
  if (queryLength != null)
    minQueryLength = queryLength;

  int maxQueryLength = DEFAULT_MAXQUERYLENGTH;
  Integer overriddenMaxQueryLength = params.getInt(MAXQUERYLENGTH);
  if (overriddenMaxQueryLength != null)
    maxQueryLength = overriddenMaxQueryLength;
  
  float maxQueryFrequency = DEFAULT_MAXQUERYFREQUENCY;
  Float queryFreq = params.getFloat(MAXQUERYFREQUENCY);
  if (queryFreq != null)
    maxQueryFrequency = queryFreq;
  
  checker.setComparator(comp);
  checker.setDistance(sd);
  checker.setMaxEdits(maxEdits);
  checker.setMinPrefix(minPrefix);
  checker.setAccuracy(minAccuracy);
  checker.setThresholdFrequency(minThreshold);
  checker.setMaxInspections(maxInspections);
  checker.setMinQueryLength(minQueryLength);
  checker.setMaxQueryLength(maxQueryLength);
  checker.setMaxQueryFrequency(maxQueryFrequency);
  checker.setLowerCaseTerms(false);
  
  return name;
}

类所在包

org.apache.lucene.search

类方法

同包方法

org.apache.lucene.search.Query

org.apache.lucene.search.IndexSearcher

org.apache.lucene.search.ScoreDoc

org.apache.lucene.search.BooleanQuery

org.apache.lucene.search.TermQuery

org.apache.lucene.search.TopDocs

org.apache.lucene.search.BooleanClause

org.apache.lucene.search.Sort

org.apache.lucene.search.BooleanClause.Occur

org.apache.lucene.search.MatchAllDocsQuery

org.apache.lucene.search.WildcardQuery

org.apache.lucene.search.SortField

org.apache.lucene.search.PhraseQuery

org.apache.lucene.search.Explanation

org.apache.lucene.search.join.ScoreMode

org.apache.lucene.search.Scorer

org.apache.lucene.search.TermRangeQuery

org.apache.lucene.search.DocIdSetIterator

org.apache.lucene.search.Weight

org.apache.lucene.search.highlight.QueryScorer

org.apache.lucene.search.highlight.Highlighter

org.apache.lucene.search.PrefixQuery

org.apache.lucene.search.SearcherManager

org.apache.lucene.search.BoostQuery

org.apache.lucene.search.TopScoreDocCollector

org.apache.lucene.search.similarities.Similarity

org.apache.lucene.search.FuzzyQuery

org.apache.lucene.search.highlight.SimpleHTMLFormatter

org.apache.lucene.search.Collector

org.apache.lucene.search.spans.SpanQuery

org.apache.lucene.search.Filter

org.apache.lucene.search.ConstantScoreQuery

org.apache.lucene.search.NumericRangeQuery

org.apache.lucene.search.Hits

org.apache.lucene.search.spans.SpanNearQuery

org.apache.lucene.search.spans.SpanTermQuery

org.apache.lucene.search.DisjunctionMaxQuery

org.apache.lucene.search.SearcherFactory

org.apache.lucene.search.similarities.BM25Similarity

org.apache.lucene.search.TotalHitCountCollector

org.apache.lucene.search.similarities.ClassicSimilarity

org.apache.lucene.search.TopFieldCollector

org.apache.lucene.search.RegexpQuery

org.apache.lucene.search.ScoreMode

org.apache.lucene.search.spans.SpanOrQuery

org.apache.lucene.search.MatchNoDocsQuery

org.apache.lucene.search.highlight.InvalidTokenOffsetsException

org.apache.lucene.search.Searcher

org.apache.lucene.search.DocIdSet

org.apache.lucene.search.LeafCollector

org.apache.lucene.search.TermStatistics

org.apache.lucene.search.similarities.TFIDFSimilarity

org.apache.lucene.search.similarities.DefaultSimilarity

org.apache.lucene.search.FieldComparator

org.apache.lucene.search.TopDocsCollector

org.apache.lucene.search.SimpleCollector

org.apache.lucene.search.ReferenceManager

org.apache.lucene.search.FieldComparatorSource

org.apache.lucene.search.spans.SpanMultiTermQueryWrapper

org.apache.lucene.search.FieldDoc

org.apache.lucene.search.CollectionStatistics

org.apache.lucene.search.spans.Spans

org.apache.lucene.search.QueryWrapperFilter

org.apache.lucene.search.TotalHits

org.apache.lucene.search.spell.SpellChecker

org.apache.lucene.search.spell.Dictionary

org.apache.lucene.search.MultiPhraseQuery

org.apache.lucene.search.ConstantScoreWeight

org.apache.lucene.search.spans.SpanWeight

org.apache.lucene.search.MultiTermQuery

org.apache.lucene.search.highlight.SimpleSpanFragmenter

org.apache.lucene.search.Scorable

org.apache.lucene.search.highlight.Scorer

org.apache.lucene.search.CollectionTerminatedException

org.apache.lucene.search.TwoPhaseIterator

org.apache.lucene.search.highlight.Fragmenter

org.apache.lucene.search.ConstantScoreScorer

org.apache.lucene.search.spell.StringDistance

org.apache.lucene.search.highlight.SimpleFragmenter

org.apache.lucene.search.spell.SuggestWord

org.apache.lucene.search.spans.SpanNotQuery

org.apache.lucene.search.BulkScorer

org.apache.lucene.search.DocValuesFieldExistsQuery

org.apache.lucene.search.spans.SpanCollector

org.apache.lucene.search.BooleanQuery.Builder

org.apache.lucene.search.highlight.TokenSources

org.apache.lucene.search.TermInSetQuery

org.apache.lucene.search.suggest.Lookup

org.apache.lucene.search.similarities.Similarity.SimScorer

org.apache.lucene.search.spell.LuceneDictionary

org.apache.lucene.search.SortedNumericSortField

org.apache.lucene.search.AutomatonQuery

org.apache.lucene.search.DoubleValuesSource

org.apache.lucene.search.highlight.Formatter

org.apache.lucene.search.suggest.Lookup.LookupResult

org.apache.lucene.search.spell.SuggestMode

org.apache.lucene.search.LeafFieldComparator

org.apache.lucene.search.DoubleValues

org.apache.lucene.search.highlight.TextFragment

org.apache.lucene.search.FilteredQuery

org.apache.lucene.search.highlight.SimpleHTMLEncoder

org.apache.lucene.search.MultiCollector

org.apache.lucene.search.join.BitSetProducer

org.apache.lucene.search.ConstantScoreRangeQuery

org.apache.lucene.search.similarities.IndependenceChiSquared

org.apache.lucene.search.spans.SpanContainingQuery

org.apache.lucene.search.spell.DirectSpellChecker

org.apache.lucene.search.TopFieldDocs

org.apache.lucene.search.highlight.WeightedSpanTermExtractor

org.apache.lucene.search.LongValuesSource

org.apache.lucene.search.grouping.GroupDocs

org.apache.lucene.search.suggest.InputIterator

org.apache.lucene.search.ConjunctionDISI

org.apache.lucene.search.similarities.PerFieldSimilarityWrapper

org.apache.lucene.search.spans.SpanWithinQuery

org.apache.lucene.search.similarities.LMJelinekMercerSimilarity

org.apache.lucene.search.similarities.LMDirichletSimilarity

org.apache.lucene.search.LRUQueryCache

org.apache.lucene.search.QueryCachingPolicy

org.apache.lucene.search.highlight.WeightedSpanTerm

org.apache.lucene.search.similarities.DFISimilarity

org.apache.lucene.search.BitsFilteredDocIdSet

org.apache.lucene.search.QueryCache

org.apache.lucene.search.FieldCache

org.apache.lucene.search.spans.FilterSpans

org.apache.lucene.search.SortField.Type

org.apache.lucene.search.spans.SpanFirstQuery

org.apache.lucene.search.SortedSetSortField

org.apache.lucene.search.grouping.TopGroups