diff options
Diffstat (limited to 'misc')
-rw-r--r-- | misc/analiza.txt | 7 |
1 files changed, 4 insertions, 3 deletions
diff --git a/misc/analiza.txt b/misc/analiza.txt index c0cca4d..1eb07ce 100644 --- a/misc/analiza.txt +++ b/misc/analiza.txt @@ -3,7 +3,7 @@ cd www; find .. -maxdepth 1 -name *.torrent | parallel ./insert.php 'mysql:host= analizirati: - kateri nestandardni ključi so v info slovarjih [izdelal @ s/nestandardni //] - encodingi -- končnice datotek +- končnice datotek [izdelal + mime] - kategoriziranje po imenih torrentov in datotek - število datotek -- percentile - velikost torrenta -- percentile @@ -13,12 +13,13 @@ analizirati: - kodeki (iz imena; x265, x264, ...) - resolucije (iz imena, 4K, 4K60fps, 720p) - top n source -- tipi vsebine: filmi/porn/knjige/revije/igrice/programi/dokumenti/ilegalne (TEŽKO, veliko ročnega dela, ChatGPT?) +- tipi vsebine: filmi/porn/knjige/revije/igrice/programi/dokumenti/ilegalne (TEŽKO, veliko ročnega dela, ChatGPT -- lahko tudi samo po tipu reprezantativne datoteke) - ip naslovi + geoip - odjemalci: verzije, popularnost v državi - porti odjemalcev -- distribucija -- koliko % torrentov ima google -- sear.c +- koliko % torrentov ima google -- sear.c (majhen sample, ne vseh) - https://pypi.org/project/parse-torrent-title/ +- graf števila prenesenih torrentov v odvisnosti od ure citirati: - bep |