org.apache.lucene.search.similarities.DefaultSimilarity源码实例Demo-ICode联盟

类org.apache.lucene.search.similarities.DefaultSimilarity源码实例Demo

下面列出了怎么用org.apache.lucene.search.similarities.DefaultSimilarity的API类实例代码及写法，或者点击链接到github查看源代码。

源代码1 项目： Elasticsearch 文件： MoreLikeThisQuery.java

@Override
public Query rewrite(IndexReader reader) throws IOException {
    XMoreLikeThis mlt = new XMoreLikeThis(reader, similarity == null ? new DefaultSimilarity() : similarity);

    mlt.setFieldNames(moreLikeFields);
    mlt.setAnalyzer(analyzer);
    mlt.setMinTermFreq(minTermFrequency);
    mlt.setMinDocFreq(minDocFreq);
    mlt.setMaxDocFreq(maxDocFreq);
    mlt.setMaxQueryTerms(maxQueryTerms);
    mlt.setMinWordLen(minWordLen);
    mlt.setMaxWordLen(maxWordLen);
    mlt.setStopWords(stopWords);
    mlt.setBoost(boostTerms);
    mlt.setBoostFactor(boostTermsFactor);

    if (this.unlikeText != null || this.unlikeFields != null) {
        handleUnlike(mlt, this.unlikeText, this.unlikeFields);
    }
    
    return createQuery(mlt);
}

源代码2 项目： modernmt 文件： ContextAnalyzerIndex.java

public ContextAnalyzerIndex(Directory directory, Rescorer rescorer) throws IOException {
    this.indexDirectory = directory;
    this.analyzer = new CorpusAnalyzer();
    this.rescorer = rescorer;

    // Index writer setup
    IndexWriterConfig indexConfig = new IndexWriterConfig(Version.LUCENE_4_10_4, this.analyzer);
    indexConfig.setOpenMode(IndexWriterConfig.OpenMode.CREATE_OR_APPEND);
    indexConfig.setSimilarity(new DefaultSimilarity() {

        @Override
        public float lengthNorm(FieldInvertState state) {
            return 1.f;
        }

    });

    this.indexWriter = new IndexWriter(this.indexDirectory, indexConfig);

    // Ensure index exists
    if (!DirectoryReader.indexExists(directory))
        this.indexWriter.commit();
}

源代码3 项目： Elasticsearch 文件： TermVectorsFilter.java

public TermVectorsFilter(Fields termVectorsByField, Fields topLevelFields, Set<String> selectedFields, @Nullable AggregatedDfs dfs) {
    this.fields = termVectorsByField;
    this.topLevelFields = topLevelFields;
    this.selectedFields = selectedFields;

    this.dfs = dfs;
    this.scoreTerms = new HashMap<>();
    this.sizes = AtomicLongMap.create();
    this.similarity = new DefaultSimilarity();
}

源代码4 项目： Elasticsearch 文件： DefaultSimilarityProvider.java

/**
 * {@inheritDoc}
 */
@Override
public DefaultSimilarity get() {
    return similarity;
}

源代码5 项目： Elasticsearch 文件： XMoreLikeThis.java

/**
 * Constructor requiring an IndexReader.
 */
public XMoreLikeThis(IndexReader ir) {
    this(ir, new DefaultSimilarity());
}

源代码6 项目： database 文件： FullTextIndexTupleSerializer.java

protected ITermDocKey<V> deserialize(final ITuple tuple,
            final boolean keyOnly) {
    
        // key is {term,docId,fieldId}
        // final byte[] key = tuple.getKey();
        //      
        // // decode the document identifier.
        // final long docId = KeyBuilder.decodeLong(key, key.length
        // - Bytes.SIZEOF_LONG /*docId*/ - Bytes.SIZEOF_INT/*fieldId*/);

        final ByteArrayBuffer kbuf = tuple.getKeyBuffer();

        /*
         * The byte offset of the docId in the key.
         * 
         * Note: This is also the byte length of the match on the unicode sort
         * key, which appears at the head of the key.
         */
        final int docIdOffset = kbuf.limit() - Bytes.SIZEOF_LONG /* docId */
                - (fieldsEnabled ? Bytes.SIZEOF_INT/* fieldId */: 0);

        final V docId = (V) (Object)Long.valueOf(KeyBuilder.decodeLong(kbuf.array(),
                docIdOffset));

        // Decode field when present
        final int fieldId;
        if (fieldsEnabled) {
            fieldId = KeyBuilder.decodeShort(kbuf.array(), kbuf.limit()
                    - Bytes.SIZEOF_INT);
        } else {
            fieldId = -1;
        }
        
        final int termWeightOffset = docIdOffset - Bytes.SIZEOF_BYTE;
        
        final byte termWeightCompact = kbuf.getByte(termWeightOffset);
        
        /*
         * See: http://lucene.apache.org/core/5_1_0/core/org/apache/lucene/search/similarities/DefaultSimilarity.html
         * 
         * For more information on the round-trip of normalized term weight.
         */
        
        final DefaultSimilarity similarity = new DefaultSimilarity();

        final double termWeight = similarity.decodeNormValue(termWeightCompact);

        if (keyOnly) {

            return new ReadOnlyTermDocKey(docId, fieldId, termWeight);
            
        }
        
//        final int termFreq;
//        final double termWeight;
//        try {
//
//            final DataInputBuffer dis = tuple.getValueStream();
//
//            termFreq = dis.readShort();
//
//            if(doublePrecision)
//                termWeight = dis.readDouble();
//            else
//                termWeight = dis.readFloat();
//            
//        } catch (IOException ex) {
//            
//            throw new RuntimeException(ex);
//
//        }
//
        return new ReadOnlyTermDocRecord<V>(null/* token */, docId, fieldId,
                /* termFreq, */ termWeight);

    }

源代码7 项目： database 文件： RDFFullTextIndexTupleSerializer.java

protected ITermDocKey deserialize(final ITuple tuple, final boolean keyOnly) {

        final ByteArrayBuffer kbuf = tuple.getKeyBuffer();

        // The byte length of the docId IV.
        final int byteLength;
        try {
//            byteLength = LongPacker.unpackInt((DataInput) tuple
//                    .getValueStream());
            byteLength = ShortPacker.unpackShort((DataInput) tuple
            		.getValueStream());
        } catch (IOException ex) {
            throw new RuntimeException(ex);
        }
        
        final int docIdOffset = kbuf.limit() - byteLength;

        // Decode the IV.
        final IV docId = (IV) IVUtility.decodeFromOffset(kbuf.array(),
                docIdOffset);

        final int termWeightOffset = docIdOffset - Bytes.SIZEOF_BYTE;
        
        final byte termWeightCompact = kbuf.getByte(termWeightOffset);
        
        /*
         * See: http://lucene.apache.org/core/old_versioned_docs/versions/3_0_2/api/all/org/apache/lucene/search/Similarity.html
         * 
         * For more information on the round-trip of normalized term weight.
         */
        
        final DefaultSimilarity similarity = new DefaultSimilarity(); 

        final double termWeight = similarity.decodeNormValue(termWeightCompact);

        if (keyOnly) {

            return new ReadOnlyTermDocKey(docId, NO_FIELD, termWeight);

        }

//        final int termFreq;
//        final double termWeight;
//        try {
//
//            final DataInputBuffer dis = tuple.getValueStream();
//
//            // skip the byte length of the IV.
//            LongPacker.unpackInt((DataInput) dis);
//            
//            termFreq = dis.readShort();
//            termFreq = LongPacker.unpackInt((DataInput) dis);

//            if (doublePrecision)
//                termWeight = dis.readDouble();
//            else
//                termWeight = dis.readFloat();
//
//        } catch (IOException ex) {
//
//            throw new RuntimeException(ex);
//
//        }

        return new ReadOnlyTermDocRecord(null/* token */, docId, NO_FIELD,
                /* termFreq, */ termWeight);

    }

源代码8 项目： database 文件： FullTextIndexTupleSerializer.java

@Override
public byte[] serializeKey(final Object obj) {

    @SuppressWarnings("unchecked")
    final ITermDocKey<V> entry = (ITermDocKey<V>) obj;

    final String termText = entry.getToken();
    
    final double termWeight = entry.getLocalTermWeight();
    
    /*
     * See: http://lucene.apache.org/core/5_1_0/core/org/apache/lucene/search/similarities/DefaultSimilarity.html
     * 
     * For more information on the round-trip of normalized term weight.
     */
    
    final DefaultSimilarity similarity = new DefaultSimilarity();
    
    final long termWeightCompact = similarity.encodeNormValue((float) termWeight);
    
    final V docId = entry.getDocId();

    final IKeyBuilder keyBuilder = getKeyBuilder();

    keyBuilder.reset();

    // the token text (or its successor as desired).
    keyBuilder
            .appendText(termText, true/* unicode */, false/* successor */);
    
    keyBuilder.append(termWeightCompact);

    keyBuilder.append((V) docId);

    if (fieldsEnabled)
        keyBuilder.append(entry.getFieldId());

    final byte[] key = keyBuilder.getKey();

    if (log.isDebugEnabled()) {

        log.debug("{" + termText + "," + docId
                + (fieldsEnabled ? "," + entry.getFieldId() : "")
                + "}, key=" + BytesUtil.toString(key));

    }

    return key;

}

源代码9 项目： database 文件： RDFFullTextIndexTupleSerializer.java

@Override
public byte[] serializeKey(final Object obj) {

    final ITermDocKey entry = (ITermDocKey) obj;

    final String termText = entry.getToken();
    
    final double termWeight = entry.getLocalTermWeight();
    
    /*
     * See: http://lucene.apache.org/core/old_versioned_docs/versions/3_0_2/api/all/org/apache/lucene/search/Similarity.html
     * 
     * For more information on the round-trip of normalized term weight.
     */
    final DefaultSimilarity similarity = new DefaultSimilarity(); 
    final long termWeightCompact = similarity.encodeNormValue((float) termWeight);
    
    final IV docId = (IV)entry.getDocId();

    final IKeyBuilder keyBuilder = getKeyBuilder();

    keyBuilder.reset();

    // the token text (or its successor as desired).
    keyBuilder
            .appendText(termText, true/* unicode */, false/* successor */);

    keyBuilder.append(termWeightCompact);

    IVUtility.encode(keyBuilder, docId);

    final byte[] key = keyBuilder.getKey();

    if (log.isDebugEnabled()) {

        log.debug("{" + termText + "," + docId + "}, key="
                + BytesUtil.toString(key));

    }

    return key;

}

类所在包

org.apache.lucene.search

类方法

同包方法

org.apache.lucene.search.Query

org.apache.lucene.search.IndexSearcher

org.apache.lucene.search.ScoreDoc

org.apache.lucene.search.BooleanQuery

org.apache.lucene.search.TermQuery

org.apache.lucene.search.TopDocs

org.apache.lucene.search.BooleanClause

org.apache.lucene.search.Sort

org.apache.lucene.search.BooleanClause.Occur

org.apache.lucene.search.MatchAllDocsQuery

org.apache.lucene.search.WildcardQuery

org.apache.lucene.search.SortField

org.apache.lucene.search.PhraseQuery

org.apache.lucene.search.Explanation

org.apache.lucene.search.join.ScoreMode

org.apache.lucene.search.Scorer

org.apache.lucene.search.TermRangeQuery

org.apache.lucene.search.DocIdSetIterator

org.apache.lucene.search.Weight

org.apache.lucene.search.highlight.QueryScorer

org.apache.lucene.search.highlight.Highlighter

org.apache.lucene.search.PrefixQuery

org.apache.lucene.search.SearcherManager

org.apache.lucene.search.BoostQuery

org.apache.lucene.search.TopScoreDocCollector

org.apache.lucene.search.similarities.Similarity

org.apache.lucene.search.FuzzyQuery

org.apache.lucene.search.highlight.SimpleHTMLFormatter

org.apache.lucene.search.Collector

org.apache.lucene.search.spans.SpanQuery

org.apache.lucene.search.Filter

org.apache.lucene.search.ConstantScoreQuery

org.apache.lucene.search.NumericRangeQuery

org.apache.lucene.search.Hits

org.apache.lucene.search.spans.SpanNearQuery

org.apache.lucene.search.spans.SpanTermQuery

org.apache.lucene.search.DisjunctionMaxQuery

org.apache.lucene.search.SearcherFactory

org.apache.lucene.search.similarities.BM25Similarity

org.apache.lucene.search.TotalHitCountCollector

org.apache.lucene.search.similarities.ClassicSimilarity

org.apache.lucene.search.TopFieldCollector

org.apache.lucene.search.RegexpQuery

org.apache.lucene.search.ScoreMode

org.apache.lucene.search.spans.SpanOrQuery

org.apache.lucene.search.MatchNoDocsQuery

org.apache.lucene.search.highlight.InvalidTokenOffsetsException

org.apache.lucene.search.Searcher

org.apache.lucene.search.DocIdSet

org.apache.lucene.search.LeafCollector

org.apache.lucene.search.TermStatistics

org.apache.lucene.search.similarities.TFIDFSimilarity

org.apache.lucene.search.similarities.DefaultSimilarity

org.apache.lucene.search.FieldComparator

org.apache.lucene.search.TopDocsCollector

org.apache.lucene.search.SimpleCollector

org.apache.lucene.search.ReferenceManager

org.apache.lucene.search.FieldComparatorSource

org.apache.lucene.search.spans.SpanMultiTermQueryWrapper

org.apache.lucene.search.FieldDoc

org.apache.lucene.search.CollectionStatistics

org.apache.lucene.search.spans.Spans

org.apache.lucene.search.QueryWrapperFilter

org.apache.lucene.search.TotalHits

org.apache.lucene.search.spell.SpellChecker

org.apache.lucene.search.spell.Dictionary

org.apache.lucene.search.MultiPhraseQuery

org.apache.lucene.search.ConstantScoreWeight

org.apache.lucene.search.spans.SpanWeight

org.apache.lucene.search.MultiTermQuery

org.apache.lucene.search.highlight.SimpleSpanFragmenter

org.apache.lucene.search.Scorable

org.apache.lucene.search.highlight.Scorer

org.apache.lucene.search.CollectionTerminatedException

org.apache.lucene.search.TwoPhaseIterator

org.apache.lucene.search.highlight.Fragmenter

org.apache.lucene.search.ConstantScoreScorer

org.apache.lucene.search.spell.StringDistance

org.apache.lucene.search.highlight.SimpleFragmenter

org.apache.lucene.search.spell.SuggestWord

org.apache.lucene.search.spans.SpanNotQuery

org.apache.lucene.search.BulkScorer

org.apache.lucene.search.DocValuesFieldExistsQuery

org.apache.lucene.search.spans.SpanCollector

org.apache.lucene.search.BooleanQuery.Builder

org.apache.lucene.search.highlight.TokenSources

org.apache.lucene.search.TermInSetQuery

org.apache.lucene.search.suggest.Lookup

org.apache.lucene.search.similarities.Similarity.SimScorer

org.apache.lucene.search.spell.LuceneDictionary

org.apache.lucene.search.SortedNumericSortField

org.apache.lucene.search.AutomatonQuery

org.apache.lucene.search.DoubleValuesSource

org.apache.lucene.search.highlight.Formatter

org.apache.lucene.search.suggest.Lookup.LookupResult

org.apache.lucene.search.spell.SuggestMode

org.apache.lucene.search.LeafFieldComparator

org.apache.lucene.search.DoubleValues

org.apache.lucene.search.highlight.TextFragment

org.apache.lucene.search.FilteredQuery

org.apache.lucene.search.highlight.SimpleHTMLEncoder

org.apache.lucene.search.MultiCollector

org.apache.lucene.search.join.BitSetProducer

org.apache.lucene.search.ConstantScoreRangeQuery

org.apache.lucene.search.similarities.IndependenceChiSquared

org.apache.lucene.search.spans.SpanContainingQuery

org.apache.lucene.search.spell.DirectSpellChecker

org.apache.lucene.search.TopFieldDocs

org.apache.lucene.search.highlight.WeightedSpanTermExtractor

org.apache.lucene.search.LongValuesSource

org.apache.lucene.search.grouping.GroupDocs

org.apache.lucene.search.suggest.InputIterator

org.apache.lucene.search.ConjunctionDISI

org.apache.lucene.search.similarities.PerFieldSimilarityWrapper

org.apache.lucene.search.spans.SpanWithinQuery

org.apache.lucene.search.similarities.LMJelinekMercerSimilarity

org.apache.lucene.search.similarities.LMDirichletSimilarity

org.apache.lucene.search.LRUQueryCache

org.apache.lucene.search.QueryCachingPolicy

org.apache.lucene.search.highlight.WeightedSpanTerm

org.apache.lucene.search.similarities.DFISimilarity

org.apache.lucene.search.BitsFilteredDocIdSet

org.apache.lucene.search.QueryCache

org.apache.lucene.search.FieldCache

org.apache.lucene.search.spans.FilterSpans

org.apache.lucene.search.SortField.Type

org.apache.lucene.search.spans.SpanFirstQuery

org.apache.lucene.search.SortedSetSortField

org.apache.lucene.search.grouping.TopGroups