عنوان مقاله ترجمه شده:زبان‌شناسي اجتماعي و برنامه‌نويسي
عنوان انگلیسی مقاله ترجمه شده:Sociolinguistics and Programming
سال انتشار مقالهنام ژورنالتعداد صفحات مقاله ترجمه شده
20156
چکیده فارسی:اين مقاله به كاربرد تكنيك‌هاي يادگيري ماشين در تحليل برنامه‌هاي كامپيوتري، با هدف كسب اطلاعات درباره جنسيت نويسنده مي‌پردازد. پژوهش‌هاي موجود اندكي به رابطه ميان زبان‌شناسي و برنامه‌نويسي مي‌پردازند: با اين حال، در بسياري از زمينه‌هايي كه زبان در آن تحليل مي‌شود، مي‌توان اطلاعات مهمي درباره كاربران آن زبان به دست آورد، كه به صفات يا شيوه‌ي كدنويسي مربوط مي‌شود. در اين پروژه از اجراي متن باز الگوريتم‌هاي يادگيري ماشين، به طور خاص نزديكترين همسايه (K* ) ، درخت تصميم (J48)، و طبقه‌بندي ‌كننده بيز (Na¨ıve Bayes) استفاده كرده‌ايم. اين الگوريتم‌ها بر روي برنامه‌هاي C++ ، كه با اطلاعات زبان‌شناسي اجتماعي برنامه‌نويسان مرتبط بودند، استفاده شدند. هدف ما، طبقه‌بندي اين برنامه‌ها بر اساس جنسيت نويسندگان آنها بود. همان‌طور كه از يافته‌هاي اوليه آشكار است، توانسته‌ايم به دقت 72.3 درصد، حساسيت 72 درصد، و معيار f-measure 71.9 درصد دست بيابيم، كه نشان مي‌دهد مي‌توانيم جنسيت نويسندگان برنامه‌هاي C++ را پيش‌بيني كنيم.
چکیده انگلیسی:This paper focuses on the use of machine learning techniques for the analysis of computer programs in order to acquire information about an author’s gender. There are few existing studies that address the relationship between linguistics and programming; however, in many areas where language is analyzed it is possible to mine important information about the users of that language associated with set of attribute or coding style. In this work we use open source implementations of machine learning algorithms, specifically, nearest neighbor (K ), decision tree (J48), and Bayes classifier (Na ¨ ıve Bayes). These algorithms were applied to C++ programs which were associated with sociolinguistic information about the program authors. Our goal was to classify the programs according to the gender of the author. As indicated by our initial results we have been able to achieve precision of 72.3%, recall of 72%, and f-measure of 71.9% which demonstrates that we can predict the gender of the authors of C++ programs.
کلمات کلیدی مقاله:
دانلود اصل مقاله ترجمه نشده افزودن به سبد خرید