Testując narzędzia czy próbując nowych technik często natrafiamy na jeden poważny problem – brak przykładowych danych testowych. Jest to jedno z większych wyzwań i bolączek informatyki śledczej.
Skąd tyle problemów?
- Po pierwsze – prywatność i ochrona danych; ze względów intuicyjnych i prawie oczywistych nie możemy używać danych ze spraw, które analizowaliśmy; większość
- Po drugie – generowanie zbiorów testowych jest trudne, stworzenie choćby jednego pełnego obrazu wymaga dużej ilości pracy i cierpliwości
- Po trzecie – jeśli stworzymy specjalny obraz, to transport takiego obrazu przez sieć jest trudny (nawet przy założeniu kompresji danych, używania małych partycji, itp.)
- Po czwarte – tworząc obraz testowy, z definicji ‘generujemy’ czyli wiemy, że chcemy osiągnąć jakiś cel
- Po piąte – paradoksalnie, jeśli weźmiemy do analizy losowy dysk również mamy problem – nie wiemy bowiem co się działo na analizowanym nośniku danych, więc nie wiemy też jak skuteczna (celna) jest nasza analiza.
Biorąc pod uwagę wszystkie z powyższych i tak chcemy mieć cokolwiek na czym możemy testować dane. Poniżej kilka przykładowych zbiorów:
1. Computer Forensic Reference Data Sets (CFReDS) – podstawowe zbiory danych stworzone przez NIST (różne dziedziny i przeznaczenia, dobre do podstawowych zajęć)
2. Digital Corpora – zbiory danych (także z telefonów komórkowych) i scenariusze
3. Enron Data Set – plik .PST dotyczący słynnej sprawy Enron
4. DFRWS (Digital Forensic Workshop Challenge) – podczas warsztatów z informatyki śledczej (raz do roku, charakter pół-akademicki) ogłaszany jest konkurs (challenge)
Ciąg dalszy nastąpi i … miłego testowania

