人工智能是一個很深奧的領域,這個學科充滿未知,知識龐大且復雜,又不斷自我顛覆﹔一旦問題稍有深入,對話就變得纏繞,越來越多的術語越講越復雜,往往隻有足夠深刻的人,才能將復雜的AI講得簡單,誰都能聽懂。這種感受在採訪張婭教授的時候,最為強烈。
張婭是民革上海交通大學委員會副主委、上海交通大學人工智能學院特聘教授、數字醫學研究院副院長,長期專注於人工智能算法及其在媒體和醫療領域的應用研究。她先后入選上海市青年科技啟明星、在中美高校及國際一流企業研究院有近20年的科研經歷﹔擔任超高清視音頻制播呈現國家實驗室首席人工智能科學家,科技部863計劃項目首席專家和科技創新2030-“新一代人工智能”重大項目負責人。
從“興趣”到“志趣”
談及進入AI行業的契機,張婭說,一切可能是偶然,也可能是命中注定。
張婭從小愛好就非常廣泛,並展現出出色的學習能力。1996年,優異的高考成績,以及當時口口相傳的“二十一世紀是生物學的世紀”合力將她帶進了清華大學生物科學與技術系。
“當時我們是一個隻有33人的小班,但真可謂是臥虎藏龍。”張婭回憶,在一群拔尖人才聚集的班級裡,大家都是來自全國各地成績名列前茅的學生,具備及其出眾的自身實力,想要再像以往那樣成為佼佼者,對她來說無疑是一個很大的挑戰。所幸,興趣是學習最大的動力,隨著課程的深入,特別是進入專業課階段后,張婭對學科的興趣與日俱增,甚至可以說有些著迷。
新千年之際,被譽為生命科學“登月計劃”的“人類基因組計劃”有了突破性進展,參與該項目的六國科學家共同宣布人類基因組草圖的繪制工作已經完成,這也意味著,曾作為單一學科獨立發展的生命科學迎來了多學科交叉融合,新技術前沿匯聚的“大科學時代”。
同年8月,張婭畢業后,進入賓夕法尼亞州立大學生物化學與分子生物學系攻讀博士學位。在實驗室輪轉期間,因所在實驗室與當時參與“人類基因組計劃”的Webb Miller教授實驗室存在合作關聯,讓張婭有機會首次接觸到“干實驗”這一前沿研究范式。所謂“干實驗”,就是利用計算機技術對生物數據進行處理與分析﹔當時,生物信息學作為一門新興學科,是“干實驗”極為重要的發展方向。
當時,恰逢賓夕法尼亞州立大學正式宣布組建信息科學與技術學院,早已對“干實驗”心生向往的張婭毫不猶豫申請轉專業,並成為學院首位博士生。跨學科的學習困難重重,生物信息學是一門要求融合生物學與計算機、統計等多領域知識的學科,而張婭只是生物背景出身,編程與機器學習等課程對她而言無疑是巨大挑戰。
為喜歡的事堅持,為堅持的事努力。張婭開始從基礎學習,過程中往往因為代碼報錯、模型搭建失敗而陷入沮喪,但那份對“干實驗”的熱忱驅使她一路堅持,不知疲倦。
終於,她的第一篇學術論文於2002年發表在美國醫學信息學會年會,並榮獲最佳論文獎提名。在這個過程中,張婭也逐漸意識到人工智能技術在處理生物信息方面的優勢,人工智能能夠高效處理海量生物數據,挖掘其中復雜的模式與關聯,與生物信息學的需求高度契合。於是,她開始專注於將人工智能技術深度融入生物信息學研究,運用機器學習算法分析基因序列和預測蛋白質相互作用。在她看來,這不單單是一次學術路徑的轉變,更是一場知識交融與創新迸發的跨學科之旅,讓她領略到了跨學科研究的無限魅力,進而轉變為對生物信息學與人工智能交叉領域的深刻熱愛與堅定追求。
“選擇”與“熱愛”同行
2005年,張婭博士畢業后任教於美國堪薩斯大學,擔任長聘教軌助理教授。彼時,生物技術正處於高速發展的黃金時期,生物信息學在基因組學、蛋白質組學、代謝組學等多個方向都展現出了極高的應用價值,成為備受矚目的焦點領域。為了支持張婭的研究工作,大學專門幫忙對接了具備高通量特性的生物實驗室來支撐她。然而,現實情況卻不盡如人意,她很快就面臨了窘境。
數據是張婭開展一切研究的核心驅動力,她深知,在當時的條件下,待在高校就好比井底之蛙。“學校裡產生數據的能力太有限了,巧婦難為無米之炊,要做好數據分析,首先得找到‘好米’,也就是高質量的數據。”
去哪裡採集數據?張婭隨即把目光投向了當時正興起的互聯網行業,“要知道,人工智能技術早期正是依托互聯網的發展而逐步興起的,互聯網上豐富多樣的數據為人工智能技術的成長提供了充足的‘養分’,它有用戶,有需求”,張婭說,進入互聯網行業來支撐她的專業,在那時無疑成為了張婭的不二之選。一番深思熟慮后,張婭決定入職當時互聯網兩大搜索巨頭企業之一的雅虎,從事搜索排序核心技術研發,助力雅虎開拓全球市場。在美國雖然可以按部就班的生活,也擁有了許多人夢寐以求的職位,但張婭始終認為,學成歸來,用自己的所學為國家發展貢獻力量,這才應該是她多年苦學的擔當,亦是她的心之所向。
科研中的專注與堅守
2010年3月,受時任上海交大副校長張文軍的感召,已在海外留學工作近十年的張婭啟程回國,加入上海交通大學電子信息與電氣工程學院圖像通信與網絡工程研究所。
回國后,張婭將研究重心投入到人工智能與媒體交叉領域,先后參與了與上海電視台和中央廣播電視總台的合作項目。融媒體時代,電視台正面臨著愈發空心化,隻有觀眾、沒有用戶的困境。“大家對電視台的刻板印象還是以做內容為王,搞技術的不容易受關注”。但張婭認為,通過技術提升觀眾的收視體驗同樣重要。為此,張婭帶領團隊開始著手建立央視第一套大數據系統,通過構建觀眾行為分析模型,精准建模觀眾收視偏好,並在此基礎上研發了面向“央視專區”互動電視的個性化推薦系統,團隊的專業表現贏得了一致認可,被總台高度評價為“個性化推薦技術在廣播電視領域應用的一個重要突破”,這也為后期雙方深度合作奠定了基礎。
2021年,恰逢慶祝中國共產黨成立100周年,張婭團隊又承擔了中央廣播電視總台《開國大典》等珍貴歷史資料影像的修復工作,“各種歷史影像退化情況不同,有的是條紋噪聲,有的是斑塊劃痕。我們修復《開國大典》原始影像時就遇到顏色通道條紋干擾”張婭說,為了解決這些問題,團隊研發了AI視頻增強平台,發明了人臉超分辨方法等系列方法,這些技術讓視頻在細節、層次、色彩和噪聲方面都有了明顯改善。憑借在該項目中的貢獻,張婭作為第一完成人獲得了2022年度上海市技術發明一等獎。
就這樣,張婭一直沿著自己既定的道路穩步前行。她表示:“高校更適合前沿性探索,我一直希望能以自己的專業所長、經歷和積澱,去從事一些有價值、有意義的事情”。近年來,張婭敏銳捕捉到人工智能與醫療交叉領域蘊含的巨大潛力,逐漸將科研重心轉向了AI+醫療行業。在國內,AI在醫療領域的應用主要落地在影像診斷、輔助決策、AI制藥等方面﹔目前,從輔助診斷到個性化治療,“AI+醫療”應用越來越廣泛,並進入了發展快車道。
作為學術帶頭人,張婭牽頭組建了一支人工智能與醫療交叉的研究團隊。“我主要是做多模態人工智能醫學大模型,從傳統意義上來講,醫生主要依靠個人經驗和知識進行診斷,而在整合了大模型之后,可以幫助醫生閱片、進行輔助診療,在提高效率的同時,降低錯漏、誤讀的可能性。”張婭介紹,這些模型能夠通過大數據分析,深入解析患者的醫療歷史、實驗室數據、基因標記等多維度信息,形成全面的健康敘述。值得一提的是,張婭作為項目負責人承擔了科技部科創 2030-“新一代人工智能”重大項目,其核心便是構建醫療多模態大模型,圍繞這一目標,她的團隊致力於攻克細粒度自監督學習、多模態數據融合、臨床驗証與應用等一系列關鍵難題。
今年,張婭被評為上海市巾幗建功標兵。她感言,作為一名女性科技工作者,我深感女性從事科學工作是不容易的,但並非不適合,因為女性有一些特點:思維嚴謹、很有韌性,這都是從事科學研究必不可少的。求索之路仍在繼續,張婭依然深耕在她所熱愛的領域,腳踏實地,精益求精,她有信心,也有耐心。