Academic Journal

Source Retrieval for a Document Using Models of Distributive Semantics

Bibliographic Details
Title: Source Retrieval for a Document Using Models of Distributive Semantics
Authors: Kreskin A.D.
Source: Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем
Publisher Information: Российский университет дружбы народов (РУДН), 2020.
Publication Year: 2020
Subject Terms: антиплагиат, выявление заимствований, дистрибутивная семантика, word2vec, source retrieval, distributive semantic, plagiarism detection
Description: В статье предложен метод выявления источников заимствований для документа, использующий модель дистрибутивной семантики для формирования множества запросов к поисковой машине. Рассмотрены основные способы выявления заимствований и их источников. Показано, как выделить из документа запросы для поиска источников, используя векторное пространство, построенное на большом корпусе текстов при помощи инструмента Word2Vec. Приведены результаты работы метода.
This paper is about method for identifying sources of plagiarism for a document, using a model of distributive semantics to form a set of queries to a search engine. The main ways of revealing plagiarisms and their sources are considered. It shows how to select queries from the document to search for sources using a vector space built on a large body of texts using the Word2Vec tool. The results of method's work are presented.
Document Type: Article
Language: Russian
Access URL: https://openrepository.ru/article?id=247694
Accession Number: edsair.httpsopenrep..76e42a2a3ea2a9fbc2c4d4fefbca1ff6
Database: OpenAIRE
FullText Text:
  Availability: 0
CustomLinks:
  – Url: https://explore.openaire.eu/search/publication?articleId=httpsopenrep%3A%3A76e42a2a3ea2a9fbc2c4d4fefbca1ff6
    Name: EDS - OpenAIRE (ns324271)
    Category: fullText
    Text: View record at OpenAIRE
Header DbId: edsair
DbLabel: OpenAIRE
An: edsair.httpsopenrep..76e42a2a3ea2a9fbc2c4d4fefbca1ff6
RelevancyScore: 837
AccessLevel: 3
PubType: Academic Journal
PubTypeId: academicJournal
PreciseRelevancyScore: 837.169860839844
IllustrationInfo
Items – Name: Title
  Label: Title
  Group: Ti
  Data: Source Retrieval for a Document Using Models of Distributive Semantics
– Name: Author
  Label: Authors
  Group: Au
  Data: <searchLink fieldCode="AR" term="%22Kreskin+A%2ED%2E%22">Kreskin A.D.</searchLink>
– Name: TitleSource
  Label: Source
  Group: Src
  Data: Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем
– Name: Publisher
  Label: Publisher Information
  Group: PubInfo
  Data: Российский университет дружбы народов (РУДН), 2020.
– Name: DatePubCY
  Label: Publication Year
  Group: Date
  Data: 2020
– Name: Subject
  Label: Subject Terms
  Group: Su
  Data: <searchLink fieldCode="DE" term="%22антиплагиат%22">антиплагиат</searchLink><br /><searchLink fieldCode="DE" term="%22выявление+заимствований%22">выявление заимствований</searchLink><br /><searchLink fieldCode="DE" term="%22дистрибутивная+семантика%22">дистрибутивная семантика</searchLink><br /><searchLink fieldCode="DE" term="%22word2vec%22">word2vec</searchLink><br /><searchLink fieldCode="DE" term="%22source+retrieval%22">source retrieval</searchLink><br /><searchLink fieldCode="DE" term="%22distributive+semantic%22">distributive semantic</searchLink><br /><searchLink fieldCode="DE" term="%22plagiarism+detection%22">plagiarism detection</searchLink>
– Name: Abstract
  Label: Description
  Group: Ab
  Data: В статье предложен метод выявления источников заимствований для документа, использующий модель дистрибутивной семантики для формирования множества запросов к поисковой машине. Рассмотрены основные способы выявления заимствований и их источников. Показано, как выделить из документа запросы для поиска источников, используя векторное пространство, построенное на большом корпусе текстов при помощи инструмента Word2Vec. Приведены результаты работы метода.<br />This paper is about method for identifying sources of plagiarism for a document, using a model of distributive semantics to form a set of queries to a search engine. The main ways of revealing plagiarisms and their sources are considered. It shows how to select queries from the document to search for sources using a vector space built on a large body of texts using the Word2Vec tool. The results of method's work are presented.
– Name: TypeDocument
  Label: Document Type
  Group: TypDoc
  Data: Article
– Name: Language
  Label: Language
  Group: Lang
  Data: Russian
– Name: URL
  Label: Access URL
  Group: URL
  Data: <link linkTarget="URL" linkTerm="https://openrepository.ru/article?id=247694" linkWindow="_blank">https://openrepository.ru/article?id=247694</link>
– Name: AN
  Label: Accession Number
  Group: ID
  Data: edsair.httpsopenrep..76e42a2a3ea2a9fbc2c4d4fefbca1ff6
PLink https://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsair&AN=edsair.httpsopenrep..76e42a2a3ea2a9fbc2c4d4fefbca1ff6
RecordInfo BibRecord:
  BibEntity:
    Languages:
      – Text: Russian
    Subjects:
      – SubjectFull: антиплагиат
        Type: general
      – SubjectFull: выявление заимствований
        Type: general
      – SubjectFull: дистрибутивная семантика
        Type: general
      – SubjectFull: word2vec
        Type: general
      – SubjectFull: source retrieval
        Type: general
      – SubjectFull: distributive semantic
        Type: general
      – SubjectFull: plagiarism detection
        Type: general
    Titles:
      – TitleFull: Source Retrieval for a Document Using Models of Distributive Semantics
        Type: main
  BibRelationships:
    HasContributorRelationships:
      – PersonEntity:
          Name:
            NameFull: Kreskin A.D.
    IsPartOfRelationships:
      – BibEntity:
          Dates:
            – D: 03
              M: 03
              Type: published
              Y: 2020
          Identifiers:
            – Type: issn-locals
              Value: edsair
            – Type: issn-locals
              Value: edsairFT
ResultId 1