我是誰?大數據與DNA解答人類大困惑
導讀:據國外科技媒體TheVerge報道,對人類祖先的永恒探求正走向結局。
系譜學(搜尋并考證人類祖先)的下一階段,將很快得到實現。大量累積的、數字化的可訪問數據結合DNA檢測的最新進展,意味著人類對家庭的困惑——他們是誰?他們怎樣到達這里?他們如何關系到我們?——這些很快能得到解答。實際上,對家族史(假定家族史存在)的追求不會超過20年:大部分的奧秘正在快速消亡。
因此,我們是誰?我們怎么到達這里?我們從何而來?我們去往何處?
上帝之子
對祖先的興趣可以追溯到歷史本身,但對于地球早期的人類來說,只有皇室和超級富豪才能研究血親家系,目的是鞏固權力與財富。然而,現代愛好者家譜目前的做法,則植根于1845年在波士頓創立的新英格蘭歷史家譜協會,使用家庭“樹”推廣系統圖表。19世紀20年代John Farmer發展了家庭樹,并沿用至今。在接下來的10年,類似協會在紐約建立,之后,尋找與開國元勛和其他革命戰爭人物間的關系十分普遍。“當美國革命之女創建后,五月花協會也隨之創建,”托馬斯·麥克恩特說,“這就是我所說的系譜學的第一階段”。美利堅聯邦共和國一成立,美國的系譜學就隨之應運而生。
新英格蘭歷史家譜協會成立后不到50年,美國系譜學領域最重要的角色誕生了,就是西部的鹽湖城。
托馬斯·麥克恩特表示,鹽湖城是家族史研究的“麥加”圣地。因為,鹽湖城也是耶穌基督后期圣徒教會及其家庭史圖書館的所在地,教會創建于1804年,是猶他州家譜協會;家庭歷史圖書館這是系譜學界最大的圖書館,而其在線門戶網站FamilySearch,日均瀏覽量約為1000萬。
摩門教的基礎教義之一即是家譜
1847年,楊百翰和其他一些后期圣徒創建了鹽湖城,鹽湖城人口剛過100萬,其中半數為后期圣徒教會成員。家庭史圖書館贊助與合作伙伴服務部高級副總裁唐納德·安德森稱,摩門教堅信“永恒的家庭”,堅信家庭有能力去“在生命之外延續”。因此考證祖先是“摩門教義的重要部分”。站在大型銀行的微電影當中,他說,“我們都是上帝之子”。
摩門教的基本教義之一就是進行系譜學研究,因為其成員們相信摩門教可以為死去的祖先施洗入教。由代理人施洗家族的行為——即,不知道祖先或未經祖先允許,因為祖先們通常都已過世——備受爭議,但那并不是多數系譜學者關注的焦點。FamilySearch和家族史圖書館工作人員歡迎摩門教徒和非魔門教徒,因為圖書館的使用,已經遠遠超過其宗教目標,且后期圣徒堅信他們的信息傳播甚廣,且所有信息全部免費。
家族史圖書館是一幢角狀的不規則現代建筑,每周六天對外開放,所有服務均免費。家族史圖書館收集了全球最多的與家譜研究相關的文檔資料、圖書和微電影,因而每年吸引了50萬人來此參觀,其中許多都是系譜學愛好者,或是專業系譜學者,他們不信仰摩門教。
后期圣徒開始于20世紀30年代末期,他們承辦了一個巨型計劃,那就是在全球范圍內尋找系譜學記載并制作成微電影。借助志愿者和傳教士大軍,后期圣徒會參觀了全球政府和教堂(教堂中保存了大量記載,直到20世紀之交),使用了240萬微縮膠卷。家族史圖書館還招募了4600位志愿者,在全球范圍內的家族史中心工作。家族史中心是小型研究便利機構,贊助者可以在主要的圖書館訂購微電影和圖書,然后通過離家近的線下工廠寄送。但在臟兮兮的圖書館(家族史中心是藝術殿堂,實際上一點都不臟),在那些長期被遺忘的泛黃的文件中發掘數據,將迅速走向歷史。感謝互聯網。
“看起來似乎互聯網為系譜學而生”
對家人的研究過程艱苦,往往吃力不討好,直到互聯網出現。與多數人一樣,如果你從頭開始——可能你知道四位祖父母的名字,其他所知甚少——就這樣開始研究幾乎完全不可能。托馬斯·麥克恩特的研究開始于20世紀70年代,他說,“不得不直接去檔案館或者倉庫”。他很幸運,就讀了位于華盛頓特區的一所大學,國家檔案館就在華盛頓特區,那里保留了美國人口普查和軍事記載的所有收集資料。“全都是紙質版本”,他說。記載要么是紙質版,要么是微縮膠卷。訪問資料需要實地前往,如果實地訪問失敗的話,就需要一封郵件命令。所有記載當然不可能有索引,因此你得準確知道你需要什么東西:如果你在尋找祖父母的死亡證明,但又不知道確切的死亡日期,那么事情很難辦到。當然,所有的家庭樹圖表,也是紙質版的,因此也很難確定一個表親與另一表親間的關系。直到2000年中,這些信息幾乎都不能在線閱覽。現在,除了某些重大記載(國家法律確定其可用性)和許多軍事服務檔案外,幾乎所有的記載,都有電子版本。
大數據結合DNA檢測
3月,近7000人趕至鹽湖城的鹽宮會議中心,在RootsTech中度過周末。RootsTech是一個年度專注于技術的系譜學會議,由非盈利家族組織FamilySearch和其他一些大牌家族行業贊助。當前系譜學的技術并不總是完全可靠,但RootsTech會議講述并鼓勵兩人發展關系。傳統而言,近退休年紀的人(多數為女性)希望找到家族組織的這個愛好,在當前是產值達到10億美元的行業,且年輕人口越來越多。
過去幾年,尋找并圖表描繪家族史已變成一種潮流,開始搜尋的技術也變得更加簡單。許多企業如Ancestry.com和FamilySearch等耗費近十年時間,將他們擁有的工具、文件記載和數據等放在網上,供使用者進行互聯網查詢,這帶來了家譜研究革命——同時,大幅降低搜尋過程的進入門檻。過去老人或擁有可支配收入的專業人士才能參與的事情,現在則迅速變成更為主流的追求。只需穩定的網絡連接和一臺筆記本電腦,就能一窺過去。
DNA檢測幾年前還需要花費數千美元,且僅能提供極少的家譜信息。而現在,越來越多的消費者選擇采用DNA檢測,追溯至數百年前,獲取做夢也想不到的大量的關于人類祖先的信息。
植根于普洛佛的家庭樹——Ancestry.com
Ancestry.com總部位于猶他州普洛佛市的一座山腳下,距鹽湖城僅45英里。Ancestry.com創建于1990年,創始人為保爾·B·艾倫(不是微軟的保爾·艾倫)、丹·塔格特(同為楊百翰大學摩門教畢業生)。企業最初作為信息庫為人所知,后來則因在軟盤上分發圣徒出版物而知名。早年Ancestry.com是一家軟件公司,他們在艾倫的汽車旁銷售帶有圣徒出版物文檔的軟盤,每份300美元。到1995年,二人將精力放在互聯網上,Ancestry.com迅速成為在線家譜研究的領頭羊。創建在線家庭樹、索引和記載的工具對外免費,但歷史文檔的真實掃描圖片需要付費瀏覽。通過付費用戶,企業賺取了大筆收入。現在,擁有全部訪問權限的用戶每年服務費用為359美元——每月30美元左右——付費用戶則超過了200萬。
Ancestry的記載包羅萬象,這意味著所有人都可以搭建自己的家庭樹。一旦用戶找到某個記載——比如說,20世紀40年代的人口普查圖——他(她)相信祖父的姓名也在人口普查圖中,那么他可以將該記載鏈接到家庭樹上寫有祖父姓名的地方。用戶的家庭樹可以是隱私的,也可以與其他人共享,并將自己的家庭樹鏈接到他人的家庭樹上。Ancestry記載功能強大、性能集中,可以合并用戶幾乎所有的研究數據。許多年前,等量的人類信息就已經填滿了手寫活頁夾與復印紙活頁夾的貨架,沒法簡單進行分享。
Ancestry.com是系譜學領域最出名的企業
Ancestry公司CEO蒂姆·沙利文在RootsTech會議上做了主題演講,他為Ancestry工作了10年。在那之前,他先是世界上最大的婚戀約會網站Match.com的COO,然后擔任了Match總裁,他也曾任職于TicketMaster和迪士尼。在沙利文的領導下,Ancestry變成系譜學領域最知名——可能也是最成功的企業。但他仍然平易近人,不似其他多數CEO。當我們走過會展中心的大廳,想找個可以交談的安靜地方時,其他人圍過來,對著我們微笑,偶爾也靠近他。“過去五年來,我們一直在搜尋,”但是現在“家族史完全社交化.”人們在一起工作——不管他們知不知道——這改善了他們自己的個人家庭樹,也改善了企業數據,因為企業可以將他們的信息拼接在一起。
沙利文的觀點十分正確,Ancestry的早期成功幾乎可以完全歸功于數據搜尋,Ancestry提供了不太匹配但不斷改善的搜索算法。基因搜索引擎如谷歌等不能分辨姓與名,而這往往意味著此類工作的全部不同之處,尤其有些祖先的名字相當常見如史密斯或泰勒。但Ancestry(和其他類似企業)創建了特制的用于單一目的的搜索引擎,這種搜索引擎能處理一種需求:與姓相關聯的名(包括變化多端的拼寫的不同組合)、日期范圍、特定范圍或寬域文檔搜索、寬地理位置(如某一國家)或特定地理位置(如某個小鎮)、一些出生日期、出生地點、其他人(如親戚家的小孩)的名字等。這款搜索引擎每日處理約4500萬次搜索量(谷歌搜索數據約為30億),或許不盡完美,但功能非常強大,且在不斷修改升級。搜索結果反饋每次數百條,按匹配度排名。通過挖掘大量的文檔和聯系數據庫,Ancestry也能自動推送“線索”——通過驚人的圖文并茂的家庭樹之葉展示——基于用戶的家庭樹,指向潛在親戚和主要來源。最近,它還首次亮相Facebook分享功能,用戶可以將自己和家人的Facebook賬號鏈接到家庭樹中,這同樣提高了企業搜索的能力。#p#
凱蒂的家庭樹

凱蒂·諾托普洛斯就是系譜學家,技術上的進步是這些變成可能。她自我描述為“業余愛好者系譜學家”,作為BuzzFeed編輯,凱蒂大約五年前開始了家譜研究。當時,一位朋友告訴她研究家譜的很有趣很好玩。她不參加系譜學會展,也不去沖洗墓碑上看不清的日期。“我只在網上研究”,她說,而這在幾年前完全不可能。
“我認為系譜學一門滯后于技術的行業,”麥克恩特說,可能因為記載的擁有者——小教會和當地政府——沒花錢去將他們的記載進行微影像化、徹底地目錄化(后來數字化)。 通常,小的縣級法院只有一個人專門處理家族史記載要求。在數碼攝影、掃描軟件、OCR(光學字符識別)技術上的進展最近才帶來了成本。
為了創建家庭樹,我們不得不成為歷史學家、偵探、語言學家
早些時候,創建家庭樹是一段孤獨的路程,常常只有過度操勞的圖書管理員或檔案管理員在那,幫助我們,了解我們發現的東西。為了獲得成功,我們還不得不掌握系譜學、歷史學、世界大事件、過去200年的移民模式等廣泛有效的知識。所有這些都發生了變化。
凱蒂已經創建了自己的家庭樹,回溯了四代血親,其中包括英國、希臘和德國祖先。使用Ancestry.com,凱蒂幾乎完成了所有工作。“最開始的時候,我找到了一個人,他已經研究了我所在家庭的一個分支很多年,這是個重大突破。”找到另一個人——不管與她多么遠親——兩人一起為同一個計劃奮斗。她說,“這十分有用,快速追溯過去變得十分容易,這看起來超級浪漫,超級興奮。”她喜歡在碎片化的時間里進行家譜研究:坐在長條凳上,看電視的時候。正是能夠解決“這些小奇跡”,才使她養成了家譜研究的良好習慣。研究活動,幫助她暫時遠離“現實生活”,她甚至找到了第三個表弟,他也在Ancestry網站上研究家族的某個分支。等他們來紐約玩時,她去看他們,還共享晚餐。在研究祖輩的網絡世界,這種現象十分常見。
我們常能聽到這樣的觀點,“所有人都相互關聯”
在系譜學社區,我們常能聽到這樣的觀點“所有人都相互關聯”, 觀點不完全錯誤:往前回溯10代,我們中的許多人會找到共同的連接點,但直到人們廣泛持有互聯網,并以所有有用的組織方式使用互聯網,這個觀點才變得正確。“看起來似乎互聯網是為系譜學而生,”托馬斯·麥克恩特說。他在鹽湖城Radisson舞廳舉辦了自己的生日派對,這是RootsTech的第三個夜晚。這是一個大型的友好聚會,系譜學領域眾多名人也紛紛參會:創建了Cyndi名單的Cyndi Howells也在那里,同行的還有FamilySearch和以色列企業MyHeritage的工作人員。托馬斯認識所有人,社區人員聯系緊密,每年在會議上相逢數次。
然而,其他時間里,他們在網上,通過互聯網幫助挖掘其他。系譜學的核心是追尋、搜索——有時甚至長達數年——只為找到通往另一位祖輩人物的關鍵線索。搜尋工作當然本質上是無止境的:絕大多數人很幸運地找到了5代或6代人物圖,到那時候,他們的家庭樹將會囊括總計5000多人。
凱蒂的DNA

(圖源:23andMe)
在互聯網的早期,系譜學家見面的最佳場所是郵箱列表和留言板,在那里,他們集中資源,互相幫助尋找剪報或出生記錄。1984年,后期圣徒出版了系譜學文件的公開標準格式,稱作GEDCOM。元數據的純文本文件可以將文件記錄鏈接到其他文件記錄中,GEDCOM可被不同類型的專有軟件讀取,并保留標準文件格式,到現在依然可以。這意味著可以彼此共享大量信息——他們的發現、他們的家庭——以一種簡單、便攜的在線方式。小型網站專注于單親家庭或編制小鎮上的訃告名單,并在網站上公示。有些人走遍整塊墓地,記下每塊墓碑內容,精心抄錄并將其登載在網上。本質上受數據驅動的愛好不可能永遠滯后。“我們知道這實際上可以趕上”,托馬斯說,當然也的確做到了。到90年代中期,小型初創企業開始看到互聯網可能意味著系譜學的巨大商機,后期圣徒會也注意到了。#p#
繼續搜索
搜索是關鍵。Ancestry.com工程部副總裁斯科特·索倫森解釋道,每次搜索結果都與元數據系列緊密相連——索引、基礎信息如某個人的名字,也與高質量的文件掃描緊密相連,盡管該文件可能距今數百年。“我們擁有100億份記錄文件、4PB數據與搜索結果緊密相連”。所有搜索都可能挖掘到10或數百的結果,按照匹配度結果排序。隨著每次的搜索,搜索引擎也得到改善:“消費者在網站上的所有交互行為,我們都能從中學習。使用機器學習技術,我們可以觀察總體消費者行為,久而久之,就能改善我們的算法,因為他們持續增加數據架構。網站的用戶,不斷對文件記錄進行評價,這樣我們可以從中學習。”最后,通過消費者交互行為,索引與記錄文件,同3800萬個單個的用戶創建的家庭樹緊密相關,在不斷擴展的龐大數據矩陣上,進一步連接到其他家庭樹,數據則代表了人們的家庭。
那么記錄文件從何而來?許多來自于后期圣徒會的家庭史圖書館。Ancestry.com與大型企業、中小型企業簽訂協議,付費后,方能訪問有價值的記錄文件。自從后期圣徒會“成為第一個吃螃蟹的人”后,在很多情況下,他們的數據相當有用——例如,將人口普查數據微縮影像化。FamilySearch CEO 丹尼斯·布林哈爾表示,由于FamilySearch是一家非盈利機構(作為教會的一部分),共享記錄文件很簡單。“我們對尋找記錄文件的人很感興趣,我們希望采用這些財務模型能有所幫助。使用我們的數據可能有效,因為我們并沒有一個財務模型,但我們真正想要做的事情是讓全球更多人可以使用更多的記錄文件。”這個想法使多數的企業考慮到系譜學商機:訪問時關鍵,不管什么人擁有什么東西,因此企業分享數據,而不是通過數字化冗余復制,互相逼迫,制造“雙倍努力”。Ancestry.com也與非盈利機構、最大的猶太人家譜網站JewishGen,以及全球最完整的用戶創建的墓碑抄錄數據庫Find A Grave建立關系。有些合作伙伴允許用戶直接訪問記錄文件,不需要離開Ancestry網站門戶;而有些合作伙伴,如英國重大記錄和人口普查索引等,允許用戶查看姓名和其他基礎信息,但如果想訪問實際圖片,用戶就需要前往該網站,接受網站的直接管理。
但同時,Ancestry在購買記錄文件上也十分活躍。斯科特·索倫森表示,Ancestry每年花費200萬美元購買新內容。在我們參觀清潔圖書館的哪天,雇員們正在使用數碼相機和專用軟件創建高中年鑒的高分辨率瀏覽文件。年鑒對系譜學而言至關重要,托馬斯麥克恩特表示,“因為年鑒是找到女性姓氏的好方法,已婚婦女經常冠以夫姓,確定女性姓氏比較困難”。Ancestry已經購買了大量的類似“次級”來源,如城市目錄、電話薄和教會目錄。一旦掃描圖像,就能轉錄名稱,嵌入元數據,同時將帶索引的圖像上傳至Ancestry網站。Ancestry還收購了一些其他的系譜學和檔案企業——小型競爭對手——以掌握他們的資源。2012年四月,Ancestry斥資10億美元收購了Archives.com,同年10月,收購了照片數字化服務公司1000memories。
FamilySearc也擁有類似功能網站,一切皆免費。當然搜索功能不如Ancestry那么強大,他們的家庭樹制作軟件業不夠健壯,但數據的大量收集每日遞增,這一增長得益于超過15萬個義務打字員,他們使用自己開發的專門的Java軟件應用程序打字抄錄。所有在家的人都可以下載該應用程序,在幾分鐘內,抄錄一系列的出生、死亡或婚姻記錄。這個過程被稱為“索引”,是FamilySearch公司最珍貴最有價值的工具之一。每年通過其成熟的轉錄和索引系統,FamilySearch公司增加了4億帶有索引的有組織的圖像。這家企業——過去通過微縮膠卷和CD刻錄機分配其記錄文件——現在可以輕而易舉地快速移動,系譜學家可以完全使用數據。從掌握該領域圖片到用戶可以讀取記錄文件的處理過程,過去需要18個月,而現在,則只需要2個月不到,當然——是在線,而不是微縮影像。

家族史蘊含巨大商機
Ancestry.com和FamilySearch可能是在線系譜學領域最出名的企業,但到目前為止,他們并非唯二的兩家,新企業正快速崛起,試圖分一杯羹。MyHeritage是一家以色列企業,創建于2003年,運營服務更偏向于家族成員的社交網絡——不管是過世的,還是活著的人——而不是傳統的家庭樹。該網站最近成功融資2500萬美元,支持38種語言。MyHeritage早期重點關注東歐等地——Ancsetry實力較弱的地盤——MyHeritage向美國用戶提供一些相當獨特的內容,在市場上獲得了很好的反響,發展迅速。英國的FindMyPast.com在美國也獲得不錯的進展,公司與英格蘭、蘇格蘭、威爾士政府的獨家關系從根本上為其提供了這些地區的重要記錄的壟斷優勢。公司CEO克里斯·范·科爾同時也是4J工作室總裁,4J工作室負責制作游戲《上古卷軸:湮沒》在索尼掌機PS3上的移植和Xbox版Minecraft游戲。他自我形容為“技術極客”,并從該角度思考系譜學。他很偶然地進入家族史行業,彼時,朋友請他申請某系譜學企業軟件的一些用戶體驗創建技巧。5年后,他仍然在這個行業,執掌英國最強大的家族史來源。“授權技術后,越來越多的人獲得正確的技術,并帶來他們自己的數據和自己的經驗,所有人就能在更大的范圍內做得更好。我們的使命是創造最驚人的家族史體驗,為盡可能多的人發掘他們的故事。”
到2010年,Ancestry已經與NBC合作,向主流美國觀眾推出《你認為你是誰?》的英國電視節目。節目特邀專業系譜學家與知名人物如莎拉·杰西卡·帕克、史蒂夫·布西密、斯派克·李等合作,開始他們的祖先故事搜尋之旅。2012年十月,Ancestry.com——這時已經上市——被一些投資者和歐洲私募股權機構Permira顧問有限公司以16億美元的金額收購,其中包括公司CEO蒂姆·沙利文。確實,家族史蘊含著巨大的商機,但在線搜索文檔并不是知道我是誰的唯一方法。如果我們想嚴肅思考、放眼未來,那么我們不得不丟開某些東西。#p#
一模一樣:DNA解決問題
在山景城,谷歌總部的角落附近,坐落著23andMe公司總部。2006年四月,一小群人創建了這家公司,其中就有生物學家安妮·沃西基,她嫁給了谷歌聯合創始人謝爾蓋·布林。23andMe是一家個人基因公司,主要目標為讓人們自己掌握自己的健康,公關總監凱瑟琳·阿法連介紹到。盡管這聽起來只是個簡單的愿景,在短短幾年前,卻是聞所未聞。
出于對科技與自己最近的研究發現間的匹配度的好奇,凱蒂最近接受了23andMe的DNA檢測和Ancestry公司的DNA檢測。她注冊了網站賬號,預定DNA測試,等輪到她后,輸入網站的條形編碼。八周后,個人祖先與健康結果顯示在她的收件箱中。
測試推出后,售價為999美元,相當便宜。但考慮到所有情況,也不是任何人都能買得起。去年12月,自宣布已經積累了18萬個DNA檢測數據庫后,23andMe將檢測成本永久降低至99美元,以獲取大筆融資,并宣布今年目標為積累100萬個檢測數據庫。盡管僅有2%的美國人接受了類似檢測,23andMe的研究表明,近71%的人雖沒有接受檢測,但他們很有興趣。
DNA如何繼承

Ancestry和23andMe的系譜學DNA結果都有相似性能。一旦處理結果——兩家企業都將測試結果傳給實驗室萃取,然后進行室內研究——用戶可以登錄賬號,查看祖輩DNA的近似組成,可追溯至500年前。例如,如果我們的祖父母是波蘭和愛爾蘭混血,那么我的DNA結果不一定密切反映這一結果,但他們告訴我們10代以前的家人來自哪里。兩種測試的結果都以地圖形式展現(如圖所示)。“有點混亂,Ancestry測試顯示我有17%的斯堪的納維亞DNA,但我的研究中并沒有發現任何斯堪的納維亞人。”凱蒂表示,這打開了系譜學家追求的過去被忽視的領域新大門。
盡管23andMe在線推送某些祖先結果,其“祖輩組成”功能——在22個全球人口基礎上,提供了相當明確、先進的信息——2012年8月推出,3個月后,Ancestry.com也推出了新的DNA檢測功能。23andMe和Ancestry.com現在都提供一樣的測試類型:正染色體DNA檢測提供所有人的具體的祖先信息。早期女性檢測只能測試MtDNA,且只提供來自母親的祖輩結果:實在是很不具體、不實用。兩家企業推出更強大的檢測后,成本驟降,意味著更多的人會去注冊賬號、檢測DNA。今年3月,Ancestry宣布其數據庫已擁有12萬多個DNA檢測結果。
但怎么進行分析呢?意料之中地,分析很復雜,而且很無趣,23andMe高級研究總監表示。基本上,我們的DNA檢測使用數百個“記號”,并與全球系譜學人口的常見“記號”進行比對。有些記號與特定地點有很強的關聯性,結果也會更加可靠,然而有些記號——比如與中歐、法國、德國有關的信號——則遠沒有那么可靠,很難做出高準確度的區分。處理過程則更加負責,事實上,在幾個世紀內,隨著人們不可避免地遷移和移民,現在活著的多數人擁有多種祖先。
因此,如果我們做了檢測,我們的DNA將與一整套的“參考”測試進行比對,參考測試收集了數千個人的DNA,他們資料完善,有較精準的系譜學位置。在最簡單的模式中,DNA與這些參考數據集匹配的地方,可以推出祖先來自那些區域的百分比。
23andMe和Ancestry.com的DNA網站次級卻可能更強大的功能提供了一些其他完全類似的比對方法:向用戶展示可能與他們有親戚關系的做了同樣測試的人。兩個網站都提供匹配度的可靠性比例,因此,舉例來說,匹配度可能表明“有95%的可能性表明,某位成員X是四代或六代表親。”如今,六代表親是很遠的遠親,但二代或三代表親(Ancestry.com檢測的許多人,找到了1至2個有如此近親關系的人)就不一樣了。二代表親是我們一代表親(父母的兄弟姐妹的孩子)的孩子;三代表親意味著你和其他人的曾祖父母是同一個人。平均而言,23andMe表示,參與檢測的每個人都能在數據庫中找到1000多個基因匹配。用戶可以選擇聯系他們——先匿名——來進行信息比對。很顯然,參與檢測的人越多,找到匹配的人越多,匹配的準確率也隨之提高,因此,兩家公司都大力推動越來越多的人參與檢測,也幫助解釋了最近的大減價行為——永遠的降至99美元。
我們正在接近未來過去祖先的奧秘將不復存在
“我們可以創建一個全新的市場,客戶們可以發現家族史,無需研究老的歷史文檔,”蒂姆·沙利文把最近的發展稱作是“人類基因學的革命”。Ancestry.com直接將用戶DNA檢測鏈接至家庭樹上,23andMe功能沒那么強大,但也允許用戶將GEDCOM文件上傳至網站,同時將數據鏈接至家庭樹上。系譜學的個人DNA檢測至今仍不普遍,也沒能發揮其全部潛能,但未來已不再遙遠。
但對于只喜歡挖掘文檔(無論是線上文檔還是線下文檔),搜尋任何能他們與過去相連的細微線索的人來說,這又意味著什么呢?在最短的短期內,搜尋工作還會繼續。但是事實上,接下來的5到10年,知道哪怕幾代以前的祖先是誰,會變得越來越簡單,只需相對較少的努力:系譜學疑惑是技術可以解決,且已經奠定了基礎的問題。在更遠的未來,完全可以相信類似“誰是我的曾祖母”這樣的血脈問題將不復存在。Facebook等社交網絡為未來親屬關系文檔奠定了基礎,他們扮演著至關重要的角色——我們創建了比過去多得多的數據。不難想象到,我們多數人的祖先的奧秘未來將不復存在。
所有的數據引領我們了解到的所有的“故事”。我們不僅僅通過圖表上列出的出生證明、出生日期與過去相連,還通過在我們之前的人的故事,與過去相連。過去10年,系譜學作為一種愛好,已經獲得了成倍增長,則歸因于大量的可搜索數據累積在互聯網上:通過Ancestry.com等企業、通過政府、通過個人。這股潮流未來只會加速發展,人們能更方便地在有限時間或資源內研究系譜學。凱蒂表示,“對我來說,我很快從意識到’他們是我的親戚’中脫身,只一心去發掘那些還活著的人,從中學習歷史。我都沒法想象‘啊,我找到了我想要知道的所有事情,這是個秘密’。”很不幸,對于那些熱愛搜尋的人來說,未來就是一次減少奧秘的旅程。