USC探究項目:電影評論中的情感和輿情分析
電影放映機 / 視覺中國
科研課題:電影評論中的情感和輿情分析
自然語言處理(Natural Language Processing)是計算機科學領域與人工智慧領域中的一個重要研究方向。以實現人與計算機之間通過自然語言進行有效通信為研究目的,通過統計學的方法,利用計算機處理大規模自然語言數據。自然語言處理是一門融合計算語言學、計算機科學、數學於一體的科學,其研究有廣泛的應用,包括語音識別、自然語言理解、自然語言生成、機器翻譯、對話系統等。
情感分析通常使用自然語言處理技術,識別客戶評論的語義情感,語句表達的情緒正負面,或者通過分析語音及文字判斷其表達的情感等來完成廣義上的主觀分析。經過初步的學習了解機器學習之後,學生可以獨立利用開源資料庫對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程,如從電影評論中分析用戶對電影的評價。
本次課題結合機器學習和自然語言處理兩門學科,在幫助學生加深對數學線性代數和機器學習重要演算法應用了解的同時,還可以讓學生利用所學知識對機器學習中向量機演算法構建數學模型對詞語情感進行分析探究。最後對比其他主流演算法,幫助學生進行結果預測和對結果預測的原因分析。
相關學科
自然語言處理情感分析
應用數學統計學數據科學
計算機人工智慧機器學習
導師:南加州大學 計算機專業碩士
南加大計算機專業碩士在讀;
本科計算機與應用數學雙專業畢業於倫斯勒理工學院;
曾研究韓語識別演算法研究,英語字詞變換研究;
本科期間獲得院長優秀學生嘉許名單
研
課題研究方法
AI+X數據驅動型科研
使用人工智慧(AI)演算法,收集、處理、分析具體學科(X)的海量數據,並基於此進行預測,從而獲得科學發現的研究方法。與傳統的、基於實驗或邏輯推理的研究方式相比,AI+X數據驅動型科研可以藉助AI演算法強大的運算能力,高效地進行大數據分析,具有投入產出比高、適用範圍廣的優點。
AI+X數據驅動型科研已被廣泛地應用於各個領域,利用AI演算法研究基因數據,從而進行早期的癌症篩查便是其中一例。基因組與癌症病患的數據千千萬萬,使用傳統的科研方式對其進行分析,工程量大、過程繁瑣,在客觀上難以實現。
但藉助AI演算法這一便捷的工具,生命科學家便能夠以海量的患者的遺傳信息為基礎,建立資料庫,與過往的研究成果進行對照,快速、準確地在兩者中發現規律、建立聯繫,從而使癌症診斷的「標準化」成為可能。
整個科研教學流程中,每一位學員都將有學術督導協助保障研究階段性作業和論文的進度,確保取得研究成果。
獎
科研項目成果
成果1
個性化個人網站展現學術研究成果
有方探究項目為學員製作個人網站展示學生的項目成果。網站展示包含項目課題介紹、研究過程、研究結論和學生學習心得等個性化內容,真實完整的反應學生的學習過程和個人學術成長與收穫。
同時,有方探究項目的項目成果還可以投放到計算機行業交流平台GitHub等業內人士交流平台中,讓更多人關注到學生的學術成果。在申請過程中,招生官極其重視學生的科研項目經歷,個人網站可以作為重要成果展示,幫助學生在諸多競爭者中脫穎而出。
成果2
能力提升
學生順利完成有方探究項目的所有課程學習後,相當於達到美國優秀大學本科三年級計算機學科方向課程項目或獨立研究項目要求。在大學申請時,獨立項目的研究經歷將極大的展現學生的學術積極性和獨立解決問題的能力。
獎
往期成果
>
2018Top30名校錄取
有方學員TOP30錄取率高達
85%
M同學
哥倫比亞大學 賓夕法尼亞大學
雙藤校錄取
學術科研成果涵蓋:人工智慧、深度學習、材料科學以及經濟金融等眾多領域
有方歷屆獲獎學員
滑動查看更多
課外科研項目錄取
L同學錄取 MIT PRIMES
H同學錄取 MIT LaunchX
MIT PRIMES 是麻省理工為精英學生打造的頂尖科研項目。在一年的時間中,項目導師首先為學生提供遠程指導,然後在暑期提供實驗室實習機會。參加這一項目可以大大提升學生進入常春藤級別頂尖名校的機會;
MIT Launch X 是一項面向世界各地高中生的創業教育課程:課程為期四周,依託MIT 獨特優勢,為學生提供頂尖創業資源,90%的MIT Launch參與者在高中時就已經嘗試了資助創業,在這其中有50%公司在 Launch X項目結束後一年仍運轉良好。
有方歷屆獲獎學員
滑動查看更多
東潤丘成桐科學獎
計算機科學獎
全球銅獎1位
全球入圍率僅3%
有方歷屆獲獎學員
滑動查看更多
獲獎證書
美國高中生數學建模競賽
2017年 HiMCM 獲獎概況
Outstanding 特等獎(全球前1%)一組
Finalist 特等獎入圍獎(全球前9%)一組
2016年 HiMCM獲獎概況
Outstanding 特等獎(全球前1%)一組
National Finalist 特等獎提名獎(全球前2%)一組
有方歷屆獲獎學員
滑動查看更多
獲獎證書
獲獎證書
期刊證書
期刊證書
期刊證書
科研課題報名須知
GIF
本項目課題研究僅限 2 個名額
註:本課程採取審核制招生,我們將通過兩輪面試評估課程匹配度,最終確定入選的學生名單。
課題要求:
本課題適合: 9-12 年級學生,有較強的邏輯思維和抽象思維能力:
英文:
具備基本的學術英語閱讀能力;
接觸過英文寫作,能初步撰寫英文文章;
數學:
概率統計基礎知識;
線性回歸;
微積分基礎;
線性代數;
計算機(推薦在課程開始前了解以下內容的基礎概念,並在課程開始後的1 - 2周內強化理解):
Python NLTK;
Python編程基礎;
Numpy庫基礎;
Scikit-learn;


※如果給你一種超能力「讀心術」,你想要嗎?
※Facebook或將面臨高額罰款,大數據時代,數據泄露應該如何應對?
TAG:Embark有方博雅 |