\begin_layout Standard
\begin_layout Title
Pridobivanje podatkov iz omrežja DHT
\begin_inset Argument 1
status open

\begin_layout Plain Layout
Pridobivanje podatkov iz omrežja DHT
\begin_layout Subtitle
Analiza pretočnega prometa skozi vozlišča protokola BitTorrent in prenos

\begin_layout Author
Anton Luka
\begin_inset space ~

\begin_inset Argument 1
status open

\begin_layout Plain Layout
Anton Luka Šijanec
\begin_layout Institute
Mentor: Andrej Šuštaršič 
 Gimnazija Bežigrad
\begin_inset Argument 1
status open

\begin_layout Plain Layout
Gimnazija Bežigrad
\begin_layout Date
 maja 2023
 maja 2023
\begin_layout Standard
\begin_layout Standard
\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Pregled vsebine



\begin_layout Standard
\begin_inset CommandInset toc
LatexCommand tableofcontents



\begin_layout Standard
\begin_layout Section
Uvod in teoretične osnove

\begin_layout Subsection
Opis protokolov

\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Opis protokolov



\begin_layout FrameSubtitle
Protokol BitTorrent

\begin_layout Itemize
P2P izmenjava podatkov brez centralnega strežnika

\begin_layout Itemize
soležnik, roj, torrent, metapodatki

\begin_layout Frame
\begin_inset Float figure
wide false
sideways false
status open

\begin_layout Plain Layout
\begin_inset Graphics
	filename bt.png
	width 40text%



\begin_layout Plain Layout
\begin_inset Caption Standard

\begin_layout Plain Layout
Shematski prikaz povezav med soležniki
LatexCommand label
name "fig:Shematski-prikaz-povezav"


Shematski prikaz povezav med soležniki



\begin_layout Plain Layout




\begin_layout Standard
\begin_inset Separator plain


\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Opis protokolov



\begin_layout FrameSubtitle
Protokol DHT
Protokol DHT

\begin_layout Itemize
Kademlia — veliko vozlišč, povezanih v graf

\begin_layout Frame


\begin_layout Standard
\begin_inset Float figure
wide false
sideways false
status open

\begin_layout Plain Layout
\begin_inset Graphics
	filename dht.png
	width 100text%



\begin_layout Plain Layout
\begin_inset Caption Standard

\begin_layout Plain Layout
Shematski prikaz DHT



\begin_layout Plain Layout




\begin_layout Standard
\begin_inset Separator plain


\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Opis protokolov



\begin_layout FrameSubtitle
Protokol DHT — proces iskanja

\begin_layout Itemize
Kompleksnost iskanja je 
\begin_inset Formula $O(\log n)$


\begin_layout Frame
\begin_inset Float figure
wide false
sideways false
status open

\begin_layout Plain Layout
\begin_inset Graphics
	filename log.png
	width 70text%



\begin_layout Plain Layout
\begin_inset Caption Standard

\begin_layout Plain Layout
\begin_inset CommandInset label
LatexCommand label
name "fig:Drevesno-iskanje-soležnikov"


Drevesno iskanje soležnikov



\begin_layout Plain Layout




\begin_layout Standard
\begin_inset Separator plain


\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Opis protokolov



\begin_layout FrameSubtitle
Protokol DHT — proces iskanja

\begin_layout Itemize
Vsako vozlišče

\begin_layout Itemize
Ima naključno generiran ID

\begin_layout Itemize
Hrani seznam soležnikov

\begin_layout Itemize
Hrani usmerjevalno tabelo (seznam) drugih vozlišč (usmerjene povezave na

\begin_layout Itemize
Poizvedba po soležnikih

\begin_layout Itemize
Zahteva: UDP paket z zgoščeno vrednostjo

\begin_layout Itemize

\begin_layout Itemize
Soležniki (če jih vozlišče ima)

\begin_layout Itemize
\begin_inset Formula $K=8$

 vozlišč iz usmerjevalne tabele, ki imajo ID blizu zgoščene vrednosti v

\begin_layout Standard
\begin_inset Separator plain


\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Osnovna predstavitev koncepta



\begin_layout Itemize
Vozlišče pridobiva seznam obstoječih torrentov s shranjevanjem zgoščenih
 vrednosti iz poizvedb in nato za vsako zgoščeno vrednost poizkusi prenesti

\begin_layout Frame
\begin_inset Float figure
wide false
sideways false
status open

\begin_layout Plain Layout


\begin_layout Plain Layout
\begin_inset Graphics
	filename p2p.png
	width 50text%



\begin_layout Plain Layout
\begin_inset Caption Standard

\begin_layout Plain Layout
Shematski prikaz grafa vozlišč DHT



\begin_layout Plain Layout




\begin_layout Subsection
Namen raziskave
\begin_inset Argument 2
status open

\begin_layout Plain Layout
Namen raziskave



\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Namen raziskave



\begin_layout Itemize
Predstaviti metodo učinkovitega odkrivanja podatkov

\begin_layout Itemize
Podatki se lahko uporabljajo za

\begin_layout Itemize
analizo vsebin, ki se prenaša po omrežju BitTorrent,

\begin_layout Itemize
analizo reprezentativnosti programske opreme,

\begin_layout Itemize
določanje izvora uporabnikov omrežja,

\begin_layout Itemize
predvidevanje preferenc uporabnikov omrežja (korelacija tipov vsebine),

\begin_layout Itemize
V nalogi je podroben opis implementacije

\begin_layout Standard
\begin_inset Separator plain


\begin_layout Subsection
Podobni obstoječi projekti

\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Podobni obstoječi projekti 



\begin_layout Itemize
Btdigg — odkrivanje vsebin

\begin_layout Itemize
I know what you download — določanje popularnosti vsebin skozi čas, shranjevanje identitete prenašalcev
 identitete prenašalcev

\begin_layout Itemize
Izpopolnitev v tej nalogi:

\begin_layout Itemize
Odprtokodna implementacija

\begin_layout Itemize
Začetek analiziranja

\begin_layout Itemize
Opis koncepta za preprostejše nadgrajevanje

\begin_layout Section
Praktično delo

\begin_layout Subsection
Program za iskanje

\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Program za iskanje



\begin_layout Itemize
Travnik v C za POSIX

\begin_layout Itemize
Povezava v omrežje, prenos vsake datoteke z metapodatki

\begin_layout Itemize
Brez stanja: možno iskati na več strežnikih hkrati

\begin_layout Itemize
Neinvazivno/nemoteče delovanje za omrežje

\begin_layout Standard
\begin_inset Separator plain


\begin_layout Subsection
Poganjanje programa — raziskovalno okolje

\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Poganjanje programa — raziskovalno okolje



\begin_layout Itemize
Domači optični priključek: en torrent na 29 sekund

\begin_layout Itemize
Težava: veliko UDP paketov ohromi linijo

\begin_layout Itemize
Dva VPS GrNet v Grčiji: en torrent na 3,5 sekunde

\begin_layout Itemize

\family typewriter

\begin_layout Standard
\begin_inset Separator plain


\begin_layout Section

\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Analiza podatkov



\begin_layout FrameSubtitle

\begin_layout Itemize
Razčlenjevalnik torrentov v Pythonu

\begin_layout Itemize
Obdelava v Jupyter Notebook

\begin_layout Itemize
285000 torrentov do 22.
 marca 2023, prejeti od 174000 različnih IP naslovov

\begin_layout Itemize
Metapodatki o 15 milijonih datotek v skupni velikosti 1,55 petabajtov

\begin_layout Itemize
Do 14.
 maja 2023 pa 773000 torrentov

\begin_layout Subsection
Primer strukture torrent datoteke z metapodatki

\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Analiza podatkov



\begin_layout FrameSubtitle
Primer strukture torrent datoteke z metapodatki

\begin_layout Itemize
Zgoščena vrednost: 
\family typewriter

\begin_layout Standard
\begin_inset ERT
status open

\begin_layout Plain Layout

lstinputlisting[language=json,firstnumber=1, breaklines=true, basicstyle=



\begin_layout Subsection
Programska oprema odjemalcev

\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout




\begin_layout FrameSubtitle
Programska oprema odjamalcev

\begin_layout Frame
\begin_inset Float figure
wide false
sideways false
status open

\begin_layout Plain Layout
\begin_inset Graphics
	filename ../dok/odjemalci_1_ods.png
	width 115text%



\begin_layout Plain Layout
\begin_inset Caption Standard

\begin_layout Plain Layout
Reprezentativnost odjemalcev, ki predstavljajo vsaj odstotek populacije
\begin_inset Formula $log$




\begin_layout Plain Layout




\begin_layout Standard
\begin_inset Separator plain


\begin_layout Subsection
Tipi datotek, ki se prenašajo v torrentih

\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Analiza podatkov



\begin_layout FrameSubtitle
Tipi datotek, ki se prenašajo v torrentih

\begin_layout Frame
\begin_inset Float figure
wide false
sideways false
status open

\begin_layout Plain Layout
\begin_inset Graphics
	filename ../dok/reprezentativni_.1_ods.png
	width 72text%



\begin_layout Plain Layout
\begin_inset Caption Standard

\begin_layout Plain Layout
Reprezentativni tipi torrentov, ki predstavljajo vsaj en promil populacije
\begin_inset Formula $log$




\begin_layout Plain Layout




\begin_layout Subsection
Spletni vmesnik za iskanje datotek

\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Analiza podatkov



\begin_layout FrameSubtitle
Spletni vmesnik za iskanje datotek

\begin_layout Itemize
Načini iskanja: regex z vsaj 
\begin_inset Formula $O(n)$

, iskalni indeks ključnih besed z 
\begin_inset Formula $O(1)$


\begin_layout Frame
\begin_inset Float figure
wide false
sideways false
status open

\begin_layout Plain Layout
\begin_inset Graphics
	filename white.gif
	width 40text%


\begin_inset Graphics
	filename inkscape.gif
	width 40text%



\begin_layout Plain Layout
\begin_inset Caption Standard

\begin_layout Plain Layout
Primer uporabniškega vmesnika za iskanje



\begin_layout Plain Layout




\begin_layout Section*
Konec predstavitve

\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Konec predstavitve



\begin_layout Itemize
Hvala za pozornost!

\begin_layout Itemize
Vprašanja, prosim!

\begin_layout Itemize
Izvorna koda programov: 
\begin_inset CommandInset href
LatexCommand href
target ""
literal "false"



\begin_layout Itemize
Izvorna koda članka in predstavitve: 
\begin_inset CommandInset href
LatexCommand href
target ""
literal "true"



\begin_layout Itemize
700000+ torrent datotek (~31 GiB) pošljem na zahtevo.

\begin_layout Itemize
\begin_inset CommandInset href
LatexCommand href
target "anton@š"
type "mailto:"
literal "true"



\begin_layout Section*
\begin_layout Subsection*

\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout



\begin_layout Itemize
Oliverju Wagnerju (
\begin_inset CommandInset href
LatexCommand href
name ""
target ""
literal "false"


) in Adrianu Sebastianu Šiški (
\begin_inset CommandInset href
LatexCommand href
name ""
target ""
literal "false"


) za pomoč pri obdelavi velike količine podatkov

\begin_layout Itemize
GrNet in njihovemu projektu ~okeanos (
\begin_inset CommandInset href
LatexCommand href
name ""
target ""
literal "false"


) za brezplačne VPS za raziskovanje

\begin_layout Subsection*
\begin_layout Bibliography
\begin_inset CommandInset bibitem
LatexCommand bibitem
key "Author1990"
literal "true"


\begin_inset ERT
status collapsed

\begin_layout Plain Layout



\emph on
Handbook of Everything
\emph default
\begin_inset ERT
status collapsed

\begin_layout Plain Layout



 Some Press, 1990.
\begin_inset ERT
status collapsed

\begin_layout Plain Layout



\begin_layout Bibliography
\begin_inset CommandInset bibitem
LatexCommand bibitem
key "Someone2002"
literal "true"


\begin_inset ERT
status collapsed

\begin_layout Plain Layout



 On this and that
\emph on

\emph default
\begin_inset ERT
status collapsed

\begin_layout Plain Layout



\emph on
Journal on This and That
\emph default
 2(1):50–100, 2000.


\begin_inset Separator plain


\begin_layout Frame
\begin_inset Argument 4
status open

\begin_layout Plain Layout
Viri slik in dovoljenje za uporabo



\begin_layout Frame


\begin_layout Itemize
Uporaba generiranega dokumenta je dovoljena v skladu s CC BY-SA (
\begin_inset CommandInset href
LatexCommand href
target ""
literal "true"


\begin_inset Newline newline

\begin_inset ERT
status open

\begin_layout Plain Layout




\begin_layout Itemize
\begin_inset CommandInset ref
LatexCommand ref
reference "fig:Shematski-prikaz-povezav"
plural "false"
caps "false"
noprefix "false"


: Scott Martin: spremenjena, izvorna pod CC BY-SA

\begin_layout Itemize
\begin_inset CommandInset ref
LatexCommand ref
reference "fig:Drevesno-iskanje-soležnikov"
plural "false"
caps "false"
noprefix "false"


: Limaner: izvorna pod CC BY-SA
