RM新时代有限公司-首页

  • 24小時(shí)服務(wù)熱線(xiàn)

    400-812-7308
    在線(xiàn)溝通,請點(diǎn)我 在線(xiàn)咨詢(xún)
    咨詢(xún)電話(huà):
    400-812-7308
    地址:
    江西省南昌市青山湖區南京東路
    您的位置:神州司法  >   機構動(dòng)態(tài)

    簡(jiǎn)單說(shuō)說(shuō)數據取證與司法鑒定中的電子數據恢復應用

    日期:2021-12-08

    跟著(zhù)網(wǎng)絡(luò )存儲、云核算、物聯(lián)網(wǎng)、視頻監控等信息技術(shù)在人們日常作業(yè)、學(xué)習、日子中的運用,各類(lèi)存儲介質(zhì)成為人們日子作業(yè)不可或缺的一個(gè)部分,海量數據存儲在核算機、網(wǎng)絡(luò )服務(wù)器及各種存儲介質(zhì)中,而一旦因各種原因導致數據丟掉、損壞,能否將其恢復就成了是否能夠挽回損失的要害。與此一同,相關(guān)運用核算機及網(wǎng)絡(luò )制作、復制傳達色情、淫穢物品案子,網(wǎng)上詐騙、敲詐勒索、網(wǎng)絡(luò )電子傳銷(xiāo)、運用互聯(lián)網(wǎng)損害國家安全等案子逐年遞加,已折射出我國司法在沖擊電子數據違法作業(yè)中面對的巨大應戰.而沖擊電子數據違法的有用辦法就是找到具有規律效能的依據,2012年修改經(jīng)過(guò)的《刑事訴訟法》和《民事訴訟法》都已將電子數據列為新的一類(lèi)依據,由此電子數據取證和司法判定在刑事、民事訴逐漸呈現重要作用.核算機上的材料被貪婪主體人為歹意刪去,怎樣經(jīng)過(guò)找回硬盤(pán)數據來(lái)取證;硬盤(pán)被不盡職主體擊打變形,怎樣經(jīng)過(guò)提取電子數據證明其不盡職;監控設備昨日的闖禍逃逸視頻今日的常規交通畫(huà)面掩蓋,什么技術(shù)能夠將暫不可見(jiàn)逃逸依據重見(jiàn)天日.信息時(shí)代,電子數據恢復不光運用于人們的日常作業(yè).日子和學(xué)習中,還成了公檢法部分破案、斷案、判案的重要一環(huán),也成為各個(gè)行政、執法機關(guān)最注重的一種電子數據取證與司法判定技術(shù)手法。

    1電子數據恢復取證與司法判定現狀

    現在,我國雖然經(jīng)過(guò)修改《刑事訴訟法》和《民事訴訟法》.現已將電子數據列為新的--類(lèi)依據,但是對電子數據取證的操作規范并沒(méi)有規律規則,電子數據恢復技術(shù)和服務(wù)規范更是缺失,公安部于200947日發(fā)布了《電子證據數據恢復檢驗技術(shù)規范》,而該規范不適用于違法現場(chǎng)勘查,一同該規范也只是簡(jiǎn)單.地對數據恢復軟件的名稱(chēng)進(jìn)行了認可;最高人民檢察院于20094月下發(fā)了《人民檢察院電子依據判定程序規則(試行),但該規則沒(méi)有觸及到電子數據恢復及其作業(yè)規范在國家規范《信息體系災害恢復規范》(GB/T209恢復-2007)中也沒(méi)有觸及到電子數據恢復.在學(xué)術(shù)研討界,對電子數據恢復取證進(jìn)行研討代表性的首要有杜江等I"]研討的公安部科技計劃立異項目:核算機取證中的數據恢復技術(shù)研討,但只針對文件體系分區表為損壞的狀況進(jìn)行數據恢復,也沒(méi)有詳細恢復算法和進(jìn)程;西安電子科技大學(xué)胡躍對依據Windows途徑磁盤(pán)取證體系數據恢復子體系研討與結束,但只針對數據恢復取證中的碎片進(jìn)行剖析,沒(méi)有將電子數據恢復取證流程規范化,也沒(méi)有規律監督;我國政法大學(xué)沈樹(shù)強8對電子依據判定視角下的數據恢復問(wèn)題研討,但只針對電子數據恢復流程進(jìn)行了研討,沒(méi)有將司法實(shí)踐中的電子數據恢復技術(shù)和作業(yè)流程相結合,也沒(méi)有規律監督.而各規律實(shí)務(wù)部分和第三方的電子數據司法判定人員一般采用。

    FTK,DataRecovery,FinalData等國外數據恢復軟件進(jìn)行電子數據恢復取證和司法判定,而我國對這些數據恢復軟件并沒(méi)有進(jìn)行資質(zhì)、合法性及其數據恢復操作規范進(jìn)行軟件測評,各公安、檢察機關(guān)及第三方的電子數據司法判定人員往往依據職業(yè)履歷或自行擬定的數據恢復辦法進(jìn)行電子數據取證和司法判定,因此判定定論的規律效能很難得到確保,電子數據作為依據的公正性、權威性.中立性遭到質(zhì)疑,這必定形成在觸及電子數據作為依據的司法實(shí)踐中影響該類(lèi)案子的判罰規范,不利于該類(lèi)案子的審理,乃至不利于。沖擊違法、維護受害人.因此,依據國內數據恢復在電子數據取證與司法判定訴訟案子中的運用狀況,學(xué)習國外數據恢復取證與司法判定的相關(guān)規范和程序,樹(shù)立一致的適應于公檢法體系的電子數據恢復取證與司法判定規范與作業(yè)流程成為一個(gè)亟待解決的問(wèn)題。

     

    2電子數據恢復取證與司法判定模型

    數據恢復分為邏輯類(lèi)恢復和物理類(lèi)恢復,物理類(lèi)數據恢復可經(jīng)過(guò)修理法和替換法結束存儲介質(zhì)的正常辨認,然后進(jìn)行物理鏡像后,便可經(jīng)過(guò)邏輯類(lèi)恢復數據,因此本文首要對邏輯類(lèi)數據恢復進(jìn)行研討.在數據被刪去后,假定沒(méi)有進(jìn)行掩蓋操作,可運用原有文件特征經(jīng)過(guò)對文件定位結束數據恢復;在已知文件類(lèi)型的狀況下,可運用已樹(shù)立的文件特征字知識庫,經(jīng)過(guò)文件特征字進(jìn)行相關(guān)快速結束數據恢復;關(guān)于部分被掩蓋的殘留數據碎片進(jìn)行數據剖析、挖掘,運用依據SVM的碎片分類(lèi)器對碎片進(jìn)行分類(lèi),再用上下文區域碎片重組算法對碎片重組,行進(jìn)了數據恢復成功率.電子數據恢復取證與司法判定模型將理論和司法實(shí)務(wù)操作相結.

    ,將數據恢復技術(shù)性和電子數據取證與司法判定程序的規律性相結合,然后既行進(jìn)了數據恢復的功率,也行進(jìn)了恢復出的電子數據的規律效能。

    2.1電子數據恢復取證與司法判定模型

    電子數據恢復取證與司法判定模型如圖1所示,模型按司法判定實(shí)務(wù)將電子數據恢復取證與司法判定流程分為數據恢復取證與司法判定托付、判定安排受理、依據時(shí)刻戳的多人數字簽名、數據恢復介質(zhì)的鏡像與哈希校驗、數據恢復取證與司法判定、撰寫(xiě)判定陳述、判定人出庭進(jìn)行依據呈堂.為確保介質(zhì)的客觀(guān)性、原始性、完整性需求有判定托付人、央求人和判定安排等多人進(jìn)行數字簽名,該簽名有政法CA發(fā)布的證書(shū)和依據時(shí)刻基準服務(wù)器的時(shí)刻戳所構成;為了確保原始數據的再現性,行進(jìn)證明力,數據恢復取證一般都需求對原始介質(zhì)進(jìn)行位對位鏡像和哈希校驗,然后運用鏡像進(jìn)行數據恢復;對電子數據恢復取證與司法判定的全程實(shí)施監督,確保數據恢復取證與司法判定出的電子數據在訴訟案子中的可采性力、證明力、規律效能和依據鏈的完整性.在電子數據恢復操作實(shí)務(wù)中,依據Windows途徑下的FATNTFS文件體系,針對文件分區表沒(méi)有損壞的文件體系,運用文件定位算法快速、精準結束數據恢復取證與司法判定;針對大容量硬盤(pán),運用文件特征字可快速高效地恢復特定類(lèi)型的文件;針對由于犯人嫌疑人歹意將文件分紅碎片躲藏文件及文件分區表?yè)p壞的狀況,運用依據SVM的碎片分類(lèi)器對文檔碎片進(jìn)行分類(lèi),再運用上下文區域重組算法重組文檔碎片.電子數據恢復取證與司法判定操作結束后,需求判定安排人員撰寫(xiě)判定陳述,進(jìn)行依據呈堂,并在必要時(shí)出庭質(zhì)證。

     

    2.2依據文件定位的數據恢復取證與司法判定,MBR(主引導記載)磁盤(pán)分區是現在運用最為廣泛的一種分區結構、所以論文首要針對MBR磁盤(pán)分區進(jìn)行文件定位數據恢復.MBR磁盤(pán)分區中,分區表占64字節,而每個(gè)分區占16字節,故最大可寄存4個(gè)主分區,當硬盤(pán)的存儲容量比較大,而且需求樹(shù)立更多磁盤(pán)分區時(shí),就必須運用擴展分區,EBR(擴展引導記載)標明,MBR磁盤(pán)分區的全體結構見(jiàn)圖2所示。

    從圖2能夠看出主磁盤(pán)分區經(jīng)過(guò)MBR中分區表進(jìn)行定位,而擴展分區之間經(jīng)過(guò)指針結構構成一個(gè)單向鏈表結束定位.FAT16的每個(gè)分區表中包含DBR,FAT1/2,FDTDATA,FAT32文件體系的FDT

    在數據區.NTFSDBR包含在$BOOT文件中,和文件有關(guān)的信息被稱(chēng)為特征,以文件記載的方式寄存在$MFT,NTFS文件體系方位結構如圖3所示。用WinHex:t1] MBR磁盤(pán)分區常見(jiàn)的文件體系進(jìn)行剖析,文件的定位算法如下:

    1)經(jīng)過(guò)查找MBR/EBR中的分區表信息,獲取每個(gè)分區的分區類(lèi)型和該分區的DBR初步扇區數(相對偏移地址一般為63號扇區);

    2)讀取DBRBPB(相對偏移地址:0DH ,0EH-0FH,10H,11H-12H16H-17H)分別獲取每簇扇區

    數、DBR保存扇區數、FAT個(gè)數、根目錄項數(-般為512)和每FAT扇區數;IF分區類(lèi)型為FAT32 ,則讀取DBRBPB相對偏移地址24H-27H獲取每FAT扇區數;IF分區類(lèi)型為NTFS,則讀取DBRBPB相對偏移地址30H-37H獲取$MFT初步簇號,跳轉到第4;

    3)FDT的初步扇區數= DBR初步扇區數+ DBR保存扇區數+FAT個(gè)數*FAT包含的扇區數,FDT占用扇區數= (根目錄項數*32)/ 512.FDT的初步方位查找已被刪去的文件名(1個(gè)字節變?yōu)?/span>E5),直到找到停止,則該目錄項相對偏移地址1AH-1BH,1CH-1FH處的數據即為該文件在DATA區的初步簇號和巨細;IF分區類(lèi)型為FAT 32,則需求將該目錄項相對偏移地址14H-15H(高位)、1AH-1BH(低位)兩處的數據兼并作為該文件在DATA區的初步簇號,由于在DATA區中,簇從2初步編號,文件的初步扇區數= FDT的初步扇區數+FDT占用扇區數(文件體系為FAT32時(shí)為0)+(初步簇號-2)*每簇扇區數,跳轉到第5;

    4)FDT初步扇區數= DBR初步扇區數+ $MFT初步簇號*每簇扇區數+5* 2(5為目錄文件的記載

    ,2為每個(gè)文件記載所占的扇區數),FDT初步方位運用Unicode編碼向下查找已被刪去的文件名,直到找到該文件的文件記載(30特征的相對偏移地址42H為該文件名),80特征的相對偏移地址08H獲取常駐特征,IF常駐特征=0,則相對偏移地址10H-13H,14H-15H處的數據即為該文件巨細和初步方位;ELSE相對偏移地址30H-37H,40H處字節的高4位數據即為該文件巨細和DataRun初步簇號,文件的初步扇區數= DBR初步扇區數+ Data Run初步簇號*每簇扇區數;

    5)跳轉到已刪去文件的初步扇區方位,按上步獲取的文件巨細,復制該文件內容,按原有文件類(lèi)型保存為一個(gè)新文件,即可結束數據恢復。依據文件定位的數據恢復,可精準恢復被刪去的文件,NTFS文件體系中,不論文件是否接連寄存,文件./目錄被刪去后都可經(jīng)過(guò)該文件記載找到初步簇號進(jìn)行數據恢復,但當要刪去的文件比較多時(shí),需求逐一恢復,作業(yè)功率比較低。

     

    2.3依據文件特征字的數據恢復取證與司法判定

    一般要恢復的電子數據都是特定的文件格局,比方*.doc.*.xls.*.jpg.*.mpg等格局,而在司懲罰

    案中往往要處理許多硬盤(pán).而且容量比較大,因此為行進(jìn)作業(yè)功率,可依據文件首、尾部特征掃描文件體系的數據區,然后供認文件的初步和結束方位.優(yōu)先快速恢復所需求的特定文件.文獻[5]運用word文件的頭部和尾部特征結束對* . doc文件的數據恢復.WinHex抓取的* .jpgl°]文件的首尾特征字如圖4、圖5所示,從圖中能夠看出* . jpg文件的頭部特征字為0x FFD8FFE000104A464946 ,尾部特征字為0xFFD90000。參照上述辦法可求得其他類(lèi)型文件的首、尾特征字,然后樹(shù)立依據文件首、尾特征字的文件特征數據庫,結束依據文件特征字的數據恢復取證與司法判定,文件特征數據庫表見(jiàn)表1所示,缺省巨細為一1時(shí)標明沒(méi)有缺省巨細,方位為0標明從初步向后查找,為一1標明從文件終究向前查找.當文件不接連存儲時(shí),NTFS文件體系中需求憑仗文件記載獲取文件存儲后續數據塊,結束特定文件的數據恢復。

     

    2.4依據文檔碎片重組的數據恢復取證與司法判定

    在電子數據取證與司法判定中,由于違法當事人刪去、格局化、文件穿插掩蓋等人為損壞,構成文檔碎片,導致許多存于文件體系元信息無(wú)法描繪的未分配區域的電子數據無(wú)法被提取,特別是當文件頭被掩蓋的狀況下,依據文件特征的數據恢復將無(wú)法正確地進(jìn)行數據恢復. Metz等針對文檔隨機碎片問(wèn)題,提出了SmartCarving結構圖,見(jiàn)圖6所示.

     

    該結構將文檔碎片恢復分為預處理、碎片收集和碎片重組3個(gè)階段,預處理階段首要處理被緊縮或被加密的數據,清掃已有文件占用的簇;碎片收集首要用于對數據塊碎片進(jìn)行分類(lèi);碎片重組是依據碎片分類(lèi)的作用,重組碎片成文件.為行進(jìn)文檔數據塊分類(lèi)的正確率,有用進(jìn)行文檔重組,然后行進(jìn)數據恢復的成功率,本文在SmartCarving結構模型的基礎上,對碎片收會(huì )集文檔分類(lèi)和碎片重組進(jìn)行了研討,提出了依據SVM的碎片分類(lèi)器。

    2.4.1 依據SVM的碎片分類(lèi)器

    在碎片收集階段首要是對許多碎片進(jìn)行文件分類(lèi),現在對碎片進(jìn)行分類(lèi)首要有依據間隔的分類(lèi)和依據機器學(xué)習的分類(lèi).依據間隔的分類(lèi)首要是運用不同的文件類(lèi)型.其字節頻率分布度(filefingerprints)不同和接連性字節差異性的特性進(jìn)行文件分類(lèi),這種辦法需求對每一個(gè)文件類(lèi)型都樹(shù)立依據字節頻率核算的文件指紋模型,然后設定閥值,假定某個(gè)文件數據塊與某一個(gè)模型的間隔低于設定的閥值,則判定為對應的文件類(lèi)型,但該辦法中很難供認一個(gè)比較志向的閥值,另外關(guān)于那些字節頻率比較類(lèi)似的文件也很難正確辨認.依據機器學(xué)習的分類(lèi)首要是在核算的基礎上樹(shù)立機器學(xué)習模型對文件數據塊進(jìn)行分類(lèi),現在最具有泛化才能和最小容錯率的支撐向量機( supported vector machines,SVM)分類(lèi)算法的研討廣受注重,運用與碎片分類(lèi)描繪如下,本文首先運用Pearson相關(guān)系數對包含有Office系列文件.JPEG、C++源碼等文件的DFRWS 2007碎片映像數據衡量碎片之間的相關(guān)性,練習SVM模型,公式如下:

     

    mn是練習會(huì )集的碎片個(gè)數,R(i)是第i個(gè)文件特征字與已知對應文件類(lèi)標(類(lèi)型規范值)的相關(guān)性,X...是第k個(gè)碎片的第i個(gè)特征字,X是第i個(gè)特征字的平均值,Y,,Y分別為第k個(gè)碎片的類(lèi)標值和整個(gè)碎片的類(lèi)標值.文件特征字包含以下幾個(gè)。

    1)文件首尾部特征字;2)針對一般文本和圖片的信息熵;3)字節/字符頻率分布特征,即文件中每個(gè)字節/字符的取值規模的核算特征;4)上下文接連字節改動(dòng)度,即數據塊中接連字節之間的平均接連性核算特征由公式(1)知,|R(i)|的改動(dòng)在01之間,值越大,外表該特征關(guān)于分類(lèi)的奉獻就越大.依據相關(guān)衡量,運用SVM-SFS[9]辦法核算每個(gè)特征字的權重,然后針對各個(gè)文件類(lèi)型樹(shù)立依據SVM的多特征字分類(lèi)器。

    2.4.2

    碎片重組

    文檔碎片重組就是對同-一類(lèi)型的碎片供認聯(lián)接次序,然后組合成多個(gè)不同的文件.運用文件首部特征字和文件摘要信息(文件長(cháng)度、時(shí)刻等文件特征信息)能夠供認文件頭碎片.而新式文件體系的特征是盡量減少碎片,因此同一個(gè)文件的碎片多以2分存在,分紅3,4個(gè)乃至多個(gè)碎片的狀況很少見(jiàn),而且在2分的狀況下一般都是從一塊接連的區域向鄰近的區域空間擴展存儲.為此,本文提出了一個(gè)上下文區域碎片重組算法如下:

    1)供認某個(gè)文件頭碎片所在區域的地址;

    2)運用依據SVM的碎片分類(lèi)器從該區域初步地址初步次序向后()查找,至到不屬于該文件類(lèi)型的碎片,則上述碎片在存儲介質(zhì)上的邏輯寄存次序即為碎片重組的次序;

    3)跳過(guò)不屬于該文件類(lèi)型的碎片,依據文件碎片頭部中的文件巨細,然后運用碎片分類(lèi)器次序起浮跳動(dòng)向后()查找相同類(lèi)型文件的數據碎片區域,而且該區域的巨細應該等于該文件剩余巨細;

    4)假定第2片區域巨細小于該文件剩余巨細,則有可能是碎片被分紅2片以上,則重復進(jìn)程3),至到查找到該文件全部碎片至,當呈現巨細相同的不同碎片區域或沒(méi)有找到剩余巨細的碎片區域時(shí),可運用時(shí)刻相同或附近的文件特性進(jìn)行碎片相關(guān)和重組。

     

    3試驗及作用剖析

    為了驗證電子數據恢復取證與司法判定模型的作業(yè)功率,選用DFRWS2007發(fā)布的數據映像作為試驗數據,巨細為256M,該數據映像首要包含OfficeWord,Excel,PDF,BMP,JPEG等文件類(lèi)型.運用Winhex供給的腳本開(kāi)發(fā)技術(shù)API函數[10]將模型中的算法運用于Winhex中進(jìn)行原型結束,然后運用電子數據取證.與司法判定中常用數據恢復軟件FTK 1. 50b, Data Recovery6. 10. 07 ,Final Data 3.0對該數據映像進(jìn)行數據恢復剖析比較。試驗環(huán)境: Intel(R)Core(TM)酷睿i5 M520@2. 40GHz雙核,內存2 G,硬盤(pán)250 G, Windows 7 Professional.依據文件類(lèi)型呈現的概率,試驗中從文檔和圖片兩大類(lèi)文件類(lèi)型中分別挑選了WordJPEG文件類(lèi)型進(jìn)行數據恢復和剖析,作用如表2,3所示。

     

    從表2,3能夠看出,關(guān)于Word,JPEG文件來(lái)說(shuō),電子數據恢復取證與司法判定模型中用到的文件定位、文件特征字和文檔碎片恢復歸納辦法,不論在掃描、恢復時(shí)刻上仍是在恢復成功率上都比一般通用數據恢復軟件的功率要高.就數據恢復成功率上差不太多,但是在時(shí)刻上則大大節省了時(shí)刻,這在政法機關(guān)進(jìn)行許多數據文檔恢復時(shí)特別如此。

    定論

    本文在對電子數據恢復取證與司法判定現狀進(jìn)行剖析的基礎上,提出一種電子數據恢復取證與司法判定模型,該模型按電子數據司法判定實(shí)務(wù)將電子數據恢復取證與司法判定流程化和規范化,運用多人數字簽名、原始介質(zhì)位對位鏡像和哈希校驗來(lái)行進(jìn)電子數據的證明力;經(jīng)過(guò)對電子數據取證與司法判定全程進(jìn)行流程監管與操作監督,確保恢復的電子數據在訴訟案子中的可采性力、證明力、規律效能和依據鏈的完整性。模型在數據恢復實(shí)踐中,依據當時(shí)Windows途徑首要運用的FATNTFS文件體系,針對文件體系分區表未損壞的狀況,提出了文件定位算法快速恢復;針對規律實(shí)務(wù)中需求恢復的特定文件類(lèi)型,提出了文件特征字算法進(jìn)行數據精準、高效恢復;而關(guān)于實(shí)踐中難于恢復的數據碎片,運用依據SVM的碎片分類(lèi)器對碎片進(jìn)行分類(lèi),再用上下文區域碎片重組算法對碎片重組,行進(jìn)了數據恢復成功率.試驗作用標明,該模型中所用到的數據恢復算法能夠針對實(shí)踐中不同的狀況下進(jìn)行有針對性數據恢復,特別是司法實(shí)踐中遇到許多文件需求恢復時(shí)將大大節省時(shí)刻,行進(jìn)作業(yè)功率,這在規律實(shí)務(wù)中很可能會(huì )有很大協(xié)助。

    下一步作業(yè)將要害研討其他文件體系,比方針對大容量U盤(pán)的ExFAT文件體系、LinuxExt文件體系(包含Android手機的YAFFS文件體系)、蘋(píng)果機的HFS+文件體系(包含移動(dòng)終端文件體系I0S);還包含其他類(lèi)型文件的特征字,豐富文件類(lèi)型特征字知識庫;并進(jìn)一步尋找更有用的碎片分類(lèi)挖掘及相關(guān)重組算法。