arXivに寄付するとき

Title:When Deep Learning Met Code Search

著者:Jose Cambronero,Hongyu Li,Seohyun Kim,Koushik Sen,Satish Chandra

Pdfダウンロード

概要:自然言語を使用したコード検索に深いニューラルネットワークを使用することについて、最近複数の提案がありました。 これらの提案に共通するのは、real mathit{embedding}codeコードと自然言語クエリのアイデアであり、実際のベクトルに変換し、次にベクトル距離を使用してコードとクエリの間の意味的相関を近似することです。 複数のアプローチが存在する学習これらの埋め込みを含む$\mathit{教師なし}$技術にとどまらざるを得なかっただけるコーパスofcode例では、$\mathit{監督}$技術を用いて$\mathit{揃え}$のコーパスの登録済みコードの自然言語説明書に記述します。 この監督の目標は、aqueryと対応する所望のコードスニペットのためのより類似している埋め込みを生成することです。 明らかに、監督された技術を使用するかどうか、そしてそうであれば、監督のためにどのようなネットワークと訓練を使用するかという選択肢があります。 この論文は、これらの選択肢を体系的に評価する最初のものです。 この目的のために、我々は、共通のプラットフォーム、トレーニングと評価コーパス上で実行するための最先端の技術の実装をassembledimplementations。 Networkcomplexityの設計空間を探索するために、既存の教師なし技術に対するmath mathit{minimal}supervision監督拡張である新しい設計点も導入しました。 私たちの評価は次のことを示しています:1。 既存の教師なし技術に監督を追加することは、必ずしも多くではないが、パフォーマンスを向上させることができます。2. 単純なネットワークforsupervisionは、より洗練されたシーケンスベースのより効果的なことができますコード検索のためのネットワーク;3. docstringを使用してsupervisionを実行するのが一般的ですが、docstringの有効性とよりクエリに適した監督コーパスの間にはかなりのギャップがあります。
評価データセットはarXivで利用可能になりました:1908.09804

科目: ソフトウェア工学(cs.SE);計算と言語(cs.CL);機械学習(cs.LG)
次のように引用してください: arXiv:1905。03813
(またはarXiv:このバージョンの場合は1905.03813v4)

コメントを残す

メールアドレスが公開されることはありません。