Lahjoita arxiville

Title:When Deep Learning Met Code Search

tekijät: Jose Cambronero, Hongyu Li, Seohyun Kim, Koushik Sen, Satish Chandra

Download PDF

Abstract: there have been moninkertainen recent proposals on using deep neural networks forcode search using natural language. Yhteistä näille ehdotuksille on $ \mathit{embedding}$ code ja natural language-kyselyt todellisiin vektoreihin ja sitten käyttämällä vektorietäisyyttä likimääräiseen semanttiseen korrelaatioon koodien ja kyselyn välillä. Näiden upotusten oppimiseen on olemassa useita lähestymistapoja, mukaan lukien $\mathit{unsupervised}$ tekniikat, jotka perustuvat vain Corpus ofcode-esimerkkeihin, ja $\mathit{valvottu}$ tekniikat, jotka käyttävät$\mathit{aligned}$ corpus-koodia ja luonnollisen kielen kuvauksia. Tämän valvonnan tavoitteena on tuottaa upotuksia, jotka ovat samankaltaisempia aquerylle ja vastaavalle halutulle koodinpätkälle. On selvää, että on mahdollista valita, käytetäänkö valvottuja tekniikoita ylipäätään, ja jos käytetään, millaista verkkoa ja koulutusta käytetään valvontaan. Tämä asiakirja on ensimmäinen, jossa näitä valintoja arvioidaan järjestelmällisesti. Tätä varten kokosimme uusimpien tekniikoiden täytäntöönpanoa yhteiselle alustalle, koulutukseen ja arviointiin. Tutkiaksemme suunnittelutilaa networkkompleksisuudessa esittelimme myös uuden suunnittelupisteen, joka on $\mathit{minimal}$valvontalaajennus olemassa olevaan valvomattomaan tekniikkaan. Arviointimme osoittaa, että: 1. valvonnan lisääminen olemassa olevaan valvomattomaan tekniikkaan voi parantaa suorituskykyä, joskaan ei välttämättä paljon. 2. simple networks forsupervision voi olla tehokkaampaa, että kehittyneempiä sekvenssipohjaisia verkkoja koodin hakuun; 3. vaikka on tavallista käyttää docstrings suorittaatarkastus, on olemassa suuri kuilu tehokkuuden docstrings ja enemmän kysely-aiheellinen valvonta corpus.
arviointiaineisto on nyt saatavilla osoitteessa arXiv:1908.09804

aiheet: ohjelmistotekniikka (cs.SE); laskenta ja kieli (cs.CL); Koneoppiminen (cs.LG)
Cite as: arXiv: 1905.03813
(tai arXiv: 1905. 03813v4 tälle versiolle)

Vastaa

Sähköpostiosoitettasi ei julkaista.