40433
当前位置: 首页   >  组内活动   >  于晓宇教授研究团队2023年第4次学术能力培训会(发布人:李博伦)
于晓宇教授研究团队2023年第4次学术能力培训会(发布人:李博伦)
发布时间:2023-03-20

一、主题:Python在科研中的基本应用

二、时间:20230319日上午900-1100

三、地点:腾讯会议线上会议室


四、主持人:马晓书(博士生)


五、主讲人:刘德虎(20级硕士研究生)


六、参会人员(19人):

博士生:尚俊茹、虞曦凯;硕士生:贾仪琳、凡静文、秦雨蒙、殷子淇、赵文静、何月飞、李天元、杨南、姚豆豆、俞俊宇、李博伦;准研一:刘晓莉、蒋宗寰、胡海霞、林红英、秦佳音、依力米冉。

七、会议流程:

1刘德虎对Python在科研中的基本应用进行讲解。

2讲解过程与会人员进行补充提问

3、最后提问环节与会人员补充分享。


八、会议内容

Part 01、刘德虎对Python在科研中的应用展开讲解

1)介绍python的定义、特征、应用场景,Python是一门高级编程语言,本质上与JavaC++等没有区别,操作简单,开发效率高,可用于文本分析、数据分析、网络爬虫。

2)详细介绍python的应用场景:1、网络爬虫的定义、操作流程、(请求数据、解析数据)、延伸操作;2、计算机辅助文本分析定义、字典法基本原理

(设计词典、文本预处理、正式分析)及其具体操作步骤。

3)详细介绍数据分析流程:Pandas数据库的导入与导出数据,检查数据,数据选取,数据清理具体步骤。

4)分享学习心得:推荐python学习书籍、方法,举例项目实战经历。

Part 02讲解过程与会人员进行补充提问

(1)对博士生曹港提出的问题进行回应:网络爬虫数据分析利用trans命令复制所需信息在网页中的位置时,只要是所示区域的每个命令都可以选取。

(2)对博士生马晓书提出的问题进行回应:计算机辅助文本分析计算词组得分时,是由同类语境出现的词组个数除以总词组个数或者是由同类语境的字数除以句子总字数。

(3)对准研一秦佳音提出的问题进行回应:对计算机辅助文本分析中的正则表达式中的【.*】命令展开了详细解释与演练。

(4)对准研一刘晓莉、研一姚豆豆提出的问题进行回应:python中很多命令都是人为编整的,在规范性方面不必过于纠结。

Part 03、最后提问环节与会人员补充分享

(1)刘德虎对此次分享进行了总结,建议先系统地学习一遍python,再进行实战演练,能较快的掌握pythonpython的理论学习比较重要,且大部分难题都可以在百度等搜索引擎获得解答。

(2)博士生曹港分享了python在科研方面目前可探索的未来方向,利用文本分析、词频等方式对二手数据进行分析,能为一些用问卷较难测量的变量提供测量思路,也是一些顶刊比较喜欢的研究方法。

(3)博士生马晓书分享了自己此次培训的感悟,一是可以将python应用于百优案例资料爬取等RP工作中,提升工作效率;二是可以将python用于跟踪顶刊文献的发表,从而对最新的学术动态进行及时浏览;三是对于如何利用文本分析技术、二手数据对新构念进行测量非常有启发。

Part 04、参会感想

通过此次德虎师兄对于python相关内容进行的详细分享,我在以下三个方面收获颇丰:一是关于科研思维的提升,曹港师兄也提到了很多顶刊并不接受问卷式的研究文章,而利用计算机辅助文本分析等技术对难以测量的变量进行衡量的方式更具有信服力,让我也拓宽了自己的思维,在科研工作中,勇于创新、与时俱进的科研思维培养也是非常重要的;二是我对RP开发的收获,在看到一篇感兴趣的顶刊文章后,如果数据可得性较高,有能力复刻整篇文章操作实验,可在此篇文章参考基础上思考其不足之处,衍生RP;三是我对自身未来的一些要求。随着chatGPT 4.0的发布,AI的浪潮汹涌而来,作为这个时代的新青年,我应该不断进行学习,包括python等计算机技能,不被时代所淘汰。

                                                 ——准研一胡海霞

本次培训会组织:总负责,马晓书;总协调,姚豆豆;课程反馈问卷,李天元;线上录屏,俞俊宇。