From 2e78f39c5c161979eeecc070d65ffe3adf237dab Mon Sep 17 00:00:00 2001
From: X <work@Xs-MacBook-Pro.local>
Date: Mon, 7 Feb 2022 01:15:46 +0100
Subject: [PATCH] new version

---
 analytics/hashtag_frequencies.py              | 108 +++++++++
 analytics/logging_analytics.py                |   4 +
 .../__pycache__/data_methods.cpython-38.pyc   | Bin 0 -> 3008 bytes
 .../__pycache__/file_methods.cpython-38.pyc   | Bin 0 -> 5193 bytes
 .../__pycache__/global_data.cpython-38.pyc    | Bin 0 -> 691 bytes
 tiktok_downloader/data_methods.py             | 123 ++++++++++
 tiktok_downloader/file_methods.py             | 202 +++++++++++++++++
 tiktok_downloader/global_data.py              |  39 ++++
 tiktok_downloader/hashtag_list.py             |   7 +
 tiktok_downloader/run_downloader.py           | 213 ++++++++++++++++++
 10 files changed, 696 insertions(+)
 create mode 100644 analytics/hashtag_frequencies.py
 create mode 100644 analytics/logging_analytics.py
 create mode 100644 tiktok_downloader/__pycache__/data_methods.cpython-38.pyc
 create mode 100644 tiktok_downloader/__pycache__/file_methods.cpython-38.pyc
 create mode 100644 tiktok_downloader/__pycache__/global_data.cpython-38.pyc
 create mode 100644 tiktok_downloader/data_methods.py
 create mode 100644 tiktok_downloader/file_methods.py
 create mode 100644 tiktok_downloader/global_data.py
 create mode 100644 tiktok_downloader/hashtag_list.py
 create mode 100644 tiktok_downloader/run_downloader.py

diff --git a/analytics/hashtag_frequencies.py b/analytics/hashtag_frequencies.py
new file mode 100644
index 0000000..79350db
--- /dev/null
+++ b/analytics/hashtag_frequencies.py
@@ -0,0 +1,108 @@
+import os, sys
+import csv, json
+import argparse
+import matplotlib.pyplot as plt
+from datetime import datetime
+
+sys.path.insert(0, '../tiktok_downloader')
+import file_methods, global_data
+
+
+
+def get_hashtags(obj):
+    if not obj:
+        print(f'ERROR: Empty item, no hashtags to be extracted.')
+        return
+    else:
+        hashtags = {}
+        l = len(obj)
+        for i in range(l):
+            for hashtag in obj[i]['hashtags']:
+                if hashtag['name'] in hashtags:
+                    hashtags[hashtag['name']].add(i)
+                else:
+                    hashtags[hashtag['name']] = {i}
+    return hashtags
+
+
+def get_occurrences(filename, n=1 , sort=True):
+    with open(filename) as f:
+        obj = json.load(f)
+        l = len(obj)
+        tags = get_hashtags(obj)
+        tags = {key: (len(value), value) for (key, value) in tags.items()}
+        if not sort:
+            k = list(tags.keys())
+            v = list(tags.values())
+            return obj, k, v 
+        else:
+            sorted_tags = {k: v for k,v in sorted(tags.items(), key=lambda item: item[1], reverse=True)}
+            k = list(sorted_tags.keys())
+            v = list(sorted_tags.values())
+            k = k[:n]
+            v_total = [i[0] for i in v]
+            v_total = v_total[:n]
+            return l, k, v_total
+
+
+
+def plot(n, length, k, v, img_folder):
+    plt.scatter(k, v)
+    plt.tight_layout()
+    plt.xticks(rotation=45)
+    plt.title(f'Hashtag Distribution')
+    plt.xlabel(f'Top {n} hashtags from {length} posts.')
+    plt.ylabel(f'Number of occurrences')
+    save_plot(plt, img_folder)
+    plt.show(block=None)
+    return
+
+
+def print_occurrences(l, k, v):
+    row_number = 0
+    total_posts = l
+    print ("{:<8} {:<15} {:<15} {:<15}".format("Rank", 'Hashtag','Occurrences',f'Frequency (Occurrences/Total-Posts({l}))'))
+    #print(f'Hashtag                  Occurrences                 Frequency(Occurances/Total-Posts)')
+    for key,value in zip(k, v):
+        ratio = value/total_posts 
+        print ("{:<8} {:<15} {:<15} {:<15}".format(row_number, key, value, ratio))
+        #print(f'{row_number}\t{key}\t\t{value}\t\t{ratio:.3f}')
+        row_number += 1
+    return
+
+
+def save_plot(plt, img_folder):
+    try:
+        now = datetime.now()
+        current_time = now.strftime("%Y_%m_%d_%H_%M_%S")
+        plt.savefig(f"{img_folder}/{current_time}.png")
+
+        return
+    except: raise
+
+
+
+if __name__ == "__main__":
+    img_folder = global_data.IMAGES
+    file_methods.check_file(img_folder, "dir")
+    parser = argparse.ArgumentParser()
+    parser.add_argument("input_file", help="The json hashtag file name")
+    parser.add_argument("n", help="The number of top n occurrences", type=int)
+    parser.add_argument("-p", "--plot", help="Plot the occurrences", action="store_true")
+    parser.add_argument("-d", "--print", help="List top n hashtags", action="store_true")
+    args = parser.parse_args()
+    if args.input_file and args.n:
+        if args.n < 1:
+            print(f"Please make sure the number of top occurrences is a positive integer.")
+            sys.exit()
+
+        base = os.path.splitext(args.input_file)[0]
+        path = f"./{base}_sorted_hashtags.csv"
+        if args.plot:
+            length, keys, values = get_occurrences(args.input_file, args.n)
+            plot(args.n, length, keys, values, img_folder)
+        else:
+            length, keys, values = get_occurrences(args.input_file, args.n)
+            print_occurrences(length, keys, values)
+    else:
+        print(f'ERROR: either {args.input_file} or {args.n} or both contains error.')
diff --git a/analytics/logging_analytics.py b/analytics/logging_analytics.py
new file mode 100644
index 0000000..cba8ca5
--- /dev/null
+++ b/analytics/logging_analytics.py
@@ -0,0 +1,4 @@
+"""
+Yet to be written ...
+"""
+
diff --git a/tiktok_downloader/__pycache__/data_methods.cpython-38.pyc b/tiktok_downloader/__pycache__/data_methods.cpython-38.pyc
new file mode 100644
index 0000000000000000000000000000000000000000..763b7483cbc765af95d3df6859af47cac2aafc10
GIT binary patch
literal 3008
zcmZWrTW=f36`t9dT`rdtB|DB&sX@DO+cZpC3Ar>VjH2kpO^`mYK&-$GftF=BBWk79
zE<HPpY<Br#<+*<#Fkro<|EQSP_9ZX<0eQ-IW=UF>m)J9BE<2oazVDnfpKWa=4A0(}
zeeu5@WB;Yj)kmQ7JG|8s2*ni7*^t^G=V!q%;G~OOoQa|EI?v@$`gP$j)Pa&Jya<L7
zv`Dp}wN$LyU$J4V64gQ5R$aA)Hc_`#Pi=q2haI(}ZeXOVZmL(%ZmC=9RkS_D@3a1E
z-{Kr>(C02G#%EgD`7GDy#cFJ|&Caw-?qx?u+UR1U7u`aik1|!IRkqMBJS^=vUvw=s
z>Ac7u&h>;0Tt6Ks)c+&i>JfzEOJUhFUh_-7lr^j6X=ILTXuE6~+Mo_E_%cEppl#Ky
zXQGa<GOlCucPr}{qp=Nr+qO|1*X@g7nbb)wj)MDa%9^(5s$ePVpy??FGsWPe!+y(k
zkFs2k&a^!)RpsKTwj<a%cB0bOC2C`+lX+HICvsgFiF5ZmPT29(N&4OicwpE)8)r%v
zBVAbYc(^^88@R~AIey1s=lMW2l-T}VFW+;ml?$EpK9uyQ|7PYU{^h&j!Dp2=)xmjb
zP7m&tlld98tPYg^Qs?E2I-{8>PxJ(XhuNtuPY>+XW~9pVA}_~En**|IZR!5(vFmwb
zHx_mYk{>}ZE_uS^)h|Jhbc_T^Ai24P6)#~LV$fsye<)M76nG`x@Cvr_9{bzPWmJo2
zK^-Z+%Pu)*5BF+O{n-iygue#SYyLHRDlafYDB)``LCIaF!png0uTE-F%cFo8fcX%Z
z`uSR1h-JHOt7w;*e_dUJu@=Vu)3hfMPVrMPgif=E(<IGVP6P8z9n#7CslIvmY`wk?
zH~%J7?9T@-Hs|w9Y7bnHsl^))e*fv<lflP#)1pjgWo4`M96^#EmGeSDnsl+9W<_d`
zF$U74zf4_B>qa1t*@EA`<q(F%;_ha%L79RdFK@WoX@f8RqS>_HG7;_5f^gAzHq(W2
z;ml-(b=#9;JvkleN8mDruLsj?V<q?;gOfHZrj={^prGhC#0rD7#jpk0G;9-F8&y){
zqRNi#9I-<aP3#z5Ii7h2H{uoAU`s!;W;_97y>l>BeE>mp!!IDp?LfN)o!Z#9L_HbA
zyoa_6*+Z|#%^iIA0tv}vic3$zBPgDDNH3sH0O|<P?DaZ8ijkmAP;<}*b4V*<8P=f^
zpvbRlqzvewn;A6iiCBGsEKAU<=&5)C{MNv=zeL!V8x+lJ`1c0Ix38n<SH8pxV#H!^
z&5f&wmN^1<zaKV;?$O2+ejYKi3#}iSAJPE9<hItIjwn|die>X-5-ADFCs)wut<h-C
z^aspVKY(B!1OjAd<$7cQ=;mjbn~;mw54oIP@A3hZ#ofl~$mQf{QQbiw@rf9fmndGv
zZS;ljBZe;}IsO5n`~fR^oYC(I`<xZQUw!QN`JgYK8}2$po6)(+tTwKVtlFskXhqlA
z*dDJ``*@}s%RPO`5y;%-^tuna^BEPjhLDF?Rqa499)N0+@4)JWN8G%Fu@}fj*=}R`
zhv+n9T2(USvP+b0Z#(i?9Vh`?<;HeSz91U*<-q&|U;E%cTp8<<CPpa)&CfCGZcK7L
zE=CQ@Xt)9)Jn9}?Z{l0D&D$id!MwFHu|fGCSW)@wh!3Y7gp=9F*d%~hKV;b^ls-iV
zC->n3RFS2tJsT)wz$d);ps@+{SfCce)?J2rEUiRdUiHuqQI{p^_$v5T)z=%nxcyI`
zY6!a}@}_OF<s0i9MvQl@zuf<mF{SYt&Cm_P#3Tp>@ZX#M9B1iMQ0Q+UE^4kI*PXIW
zmCvtepg+b=E9eRM1i7e-Fi5z0A2TmNPmUo6deSQ>7U0($#v#L;aJ&IZ$%iOt03P`Q
znZ}nj%%QMF>)e5Pd1W5%qIrelctT&bp0?L3y}RPUBJx+ObaBI%5=t4z<LVe!kaQ8H
zW25h;i`$!YQ_gK#9;MAS>^q(=TE9rkB7dAN-lDauo7sMPzoeTFa(<ds>9i!}+?2(1
ze}5lzB;(DyB;F(8^NoD&Z`>^DM&X0auewIPj;}e5pDi}12qXrtcKPc_DQ|M~EA%PM
zw_Q+Ht}`j~95<P)EGk2UGy=kPrg{0rIQONcNe6_1N54siR117|@`394+#H>@zXH8K
op07mlZ_Y|J&-HJq)>cF^DlT2bL@W}Xi1=1~C%&0<<2deq551|l=>Px#

literal 0
HcmV?d00001

diff --git a/tiktok_downloader/__pycache__/file_methods.cpython-38.pyc b/tiktok_downloader/__pycache__/file_methods.cpython-38.pyc
new file mode 100644
index 0000000000000000000000000000000000000000..2c160ee3b078673a9e97a9a5070dff4c5914bf38
GIT binary patch
literal 5193
zcma)A&2JmW6`$EJt|*C;6~~qwCs{RCRJxIrrfp)lZkxn*zL3y}<irWlf~7bsi59s_
z&yK8mu`G%>?JY=9^iZ@BAS0Lh)<cgy^pL-x$L+DF{0l;X^!H|#qR2QvDDCWg@9cZO
z_ulXAd(+cphTqvH+x*W0WB;Yb$)AnJ%ea!ipb$*(4y&6xuXEkD>K5)+$L`v7o0~DG
z?&vYM?h0EtAG5kAT;btf5+&i|?u!Xg#(hFeiYeU7Vp>#ipA<7<7WXM}O3dLtEglo6
zaj%HS#TndZ#91+q`>c3EEQoU-^ZF^lH(2%jS2!Q5ReA1<rV3TN8@4R!Dt=U-z;zW@
z@-~W$3%+Z~dBtw?4Cfd2Cl+VX^XPZbe@R*Bb?;lBdYs*2KVk2(b@l;^W|b|xjQ^F1
z(t&-S)BED-el52}TeiREjNu4QHx^;;Y_&UK&iB*G_4V}|>z9MDt#(2gr1L>6gLV=`
zu?qIXPA3rIRyzvCYSqcDILZBPb2r3xN$$kGFv{JYY)7hU<xbS>hWP~T+fes<;X@{;
z@hV64wfB-xCTsh#++DjCxAwYWq>?oe-VHl(j~b1hjBkf6blz<5s(5!zoxC+fydQPq
zrU>Pl-n<*ComeERy?gm&ONJ0=gZfJ(yb21&eLjn8icMLwT+X298`37^Xld6_DWv@r
zN&66zeZb|sur`>mH(2ysA@eJG)YhXf9*<U(qvh=$Soiryz#Qc5)ufAEZ@wn!Dd}Rc
z(@X*t2b*Eg43;6fWfC!}bn4~B#l@;C>F~MJYpR{xYbP|2yX^#X^U{rt>r%$@p;gG1
zCdnzx*Wxt=y>>p++6h~`jqo?^M1@f+JcZ6=4h0EhiaVA!xLfiJdPjspN2Tj3uH-xl
z#WD!yzSXxfE16e-A+-uf@mkgFp`}~3<>OeP50!g~YO1|t{BUJ+IC`^y9^s>4yv!Y5
z2F_6*IgN)7y7X!OjmkhZf-m44WD*PPf!((hJG3+F0id3KE^Ms|=fLjU%DL@k_BMxM
z!?ZuK`%dQE_T=YO9>UBY@I(Ir6aE70yJ8}9cRi_SFHxqwGWQk~sbKzk$EnPPNlhQP
zWKzRfx3qah!LSD_Dtg6?F+Vfo7K<vJ(ceexLl#*d7_*$M<qo_-6BZOFDmgl9P`{G2
zWU~iL1Zs9vb2~`O!HNo&ZzplIeDk4Iue6#ywI{<yyr+75DtD6|m}%<nsjZbuUww^V
z?$G3;bE~Us=HKjm!jRH;3#;FV$(q{H_Hq*J%Q)H&_TdMD{hg*FCm=&S3C166-V4T#
zw*?HtV+@b!1S`SCbpGPNc{Bq$ML-${#uw8o#UpF6?hE!|700G+o`CJX<tayQK$}#{
z+EU~!Ac41x+wecF9Ws-0vbPC0(h8F#x8+_$I24dj?uoEP4$n<`owkw`P^w<;C!tb!
zZA^xY&3=_aOs%-vZAK#ZWSH!ARNarleeGe!F<luPzo9kweQcdvK*9JtkZr-{=D5dC
z!|KZ1v(BLOtukB_T1>8B-U#N&B91YCgvNKk{FmPW^Irm=Ks@2{0G85sGgp4L&H7&E
zUSq#H*DqxVdSc@Duqf2MLqCIcaCS!wah-Xi_F&LG9EY_bM8Ya73yhuuo14)AYt%Mo
zwQZdG4z@8@lZf{$_wKeu7$@=xG*UZQ5jQ3Irqo_tdqyIhv9JCIyvu<4F5P-%z4m79
z^~(Verq^kl0oS1nPa<s`xjA1wD#>oJBDaEk+B~r#!cM5dhg?2Md%ttM_p!lX+XxYI
zXftFCW9T)f7@#B=JXkJb&+6n5%JO^Ykk3#-_>oIgJc}YPb>Pei-(ItaXe%^+bEnnp
zbgI6r(!7gQkU_{FQ1Kj!`eTD<hN3|`G*q_-b}|U0rc+0$aZDdiY8XNM0^23DX8~%<
zfO-~=+tJ}<3Xt{?XUqJY0k;Kkzl8ZM($C;Wp@mFOJM`yKq3|LQP(D51=Zc~(2Q(3C
zZZWIiGhe_38(yQMs#VLmM5G~}B%el+J46bK*pu@ujhOM*@wY?OATRq%tVqbb7|gQF
z<xf!?F+V!tF$Wtvp=C~pK!X4{;9Fm4H$HMgNe>u3quA^A2Jw*~EiY3+#K;sna!=4K
zeauY^93OLv%b%e=B1k&ov6pxQA{M;QKjZ0Yn?ZaG7X6RDo!L50T8L_YLLHWE+NOVj
zp?@>82Cd-?mm#{E`B?K32*DK=1;d_4t+_(+_{5q%zcV}BaX8ZEgVm2(LB3Ad@Ia2T
z4($hs%9(rU2nV3>l$$w3cF9wH#$`o$nRB1_eeCCF-W8@wnUnd%O`^HX%d9rWhJDH(
zrNkyCKO!FcHRDkTwz=1dx3@!?o>~$sOWl>F4}+yQE-$@vd1*siO?rA`uSKzDYp>I}
z7wE|%NT&k$1lbM~gsR2rL_WFQi8q@at=Zgt?ajBZZ%E?$xgEv(h(StjQ7)j_m`0@5
zw~0{`xsPp&r7Bj<PTh30TdHouJ4rH4`6`Nf3EMTWn><Th8fIe%E7M;4vaLe7jXB8+
zD44ckW5x6Qq80EteIZQ2LSWUngE(5$nneqC{Tf!a99moah__PU(sun%RMNk}vN_b_
zWVTf4B_fV!xlk67tQRuWG|YGbFCXwhAJho=W>7O(*quK(Oxd?V;&#ijXOx8<I8^Hn
z=Y5EI$a?0!IiftlGY6y%d!n=rb;CSo%R=DO;q03bc<9v9^2U2tuU_BS0GUbW2I>r&
zLVyH;!ynnu?88!Scf#m|#<V{w8KxognYT7>)UIjTp{cu3Xi1agT(b%CNXBt%ja`S}
zjM}bIZA^C)ZBeN14;W3JMZv%>e5j8~A8PY?1zf|_%KQv!T3wXfw8*gyew3FStLu+w
zq`xiH1r{yePoFB(1-6_)L1c|kic=^>oKVVop%f^3I0p(5PzX5i$zH7tdt4dcW{2{1
z981250%?&>E8d}wF*%KiXp#t6A*2ILPXZL9LLvb<5ET**2uO?P2Ih>!0J2R&w?^~t
zP#Gja$$5p0Tw}>H^d<T=@<JQA_^afwC@Vy2fb3k)am^fxTbSix)(&Q2?AvBxr6y>?
zAFk9<Z=#ki7QFctrNVAc5ef}C3AUQx)?$@_D&o+j>^l1cMva?#e8f$eWg?Jo;MGiW
zS}HbAmxCw_#UM{DJ_eW!m9kZnwqjo>g>pv?X_K{rCU@hzAlR}Cq9RYz=(u{!lQoI{
zJH``A_$d1$%#w2<C#3I`u&-lm1hu4+<IwzPG}4a=t(k>r_ZFg^j&3k@`tV_LK*ToG
zorBU@q8Ton3&j_Y>cmhXY@Pdot2*?lhq&sUvYs=Ek*R{k79+~i+*bFB%7DE-GN+p{
zy!D8$r4wt0K&?HKI;-8@kL!~Kv)qz#H?_NWgCic~6Gf+rZ^|Fx&EyZMAn%+8kJKHp
z%&oYCk0GS?q84u%!kesuYFwZlUZg_jI?f4}s4a<nz_@}=wK`!lGL%niDft&>6(0{Q
zt)2_~f;ErC#^dsRj8*XoV9qdDa(?EiWIys{6!{c+xJL1%Mt>wQup!0k)JIdq6CRWz
zizI&~$tpDl^m9&}RD(+MCI1S(VeNIopHr+(o<cDXRtHyT`(=N|_x-c}lfLJ>{?n*E
H=Fk2gd_aH}

literal 0
HcmV?d00001

diff --git a/tiktok_downloader/__pycache__/global_data.cpython-38.pyc b/tiktok_downloader/__pycache__/global_data.cpython-38.pyc
new file mode 100644
index 0000000000000000000000000000000000000000..9a9cfc1ed99cfc714ed1d594925f0a89d9336d2a
GIT binary patch
literal 691
zcmY*VOK#gR5T!^-mgG1e_Y~e(K-Wc419k%gaUDcXfpR0ro~fW%G6hmeP#>ZfaB_ei
zqu1cJs~n)400l}aag&nZ<IJ1K2hLpfdJ!?}=aMXEjF4Y8dA*KI^1&SS-2f0yz~K&1
zPJwX-E_ada2zd9Dd*E{)I=lk`4<O_r5_FIvLl?bP6`^Ca5&AoF|3A}dnP5k9@~ot-
zGPFE&@47sK1Kx!m9Kz8Z<p*$_kip5eGaSZ{HJN4wD9uWdYp)inQQE&L0EODRaZ%;l
zo+VSG8D1%|*&epVmprr{Po=<kw9%sz54zg573rAXCADBiM5Jqg`$d)IsC2Nm*5N-_
z-5RD}ixPPV;&xMt%>2(c-Z@H59<0qnU|>M?v0BNjMww<!gH>(*?x_;7{xs-ucRX5*
zIGc_W&d%ni+&iBqi-h~1r{l@o+|$|UbdvDE(y3L2ZRIJnZ_|&{vk4E(+cwgk%@fU<
zEZ5Qb=wdXREG8Gp4<g^#&MZ8Bi7ypO72gWEj>lqkUE!utG2jiBqP9s|OL2uOLoSMS
zBi3>A`bzg5qm1)XEVD9g=Uac%!MjSpb&2ooFx6WFuCw0}dyZV{yzIWyHwx<XfBPpc
Iqm=&n3n0P1=>Px#

literal 0
HcmV?d00001

diff --git a/tiktok_downloader/data_methods.py b/tiktok_downloader/data_methods.py
new file mode 100644
index 0000000..c35e2a4
--- /dev/null
+++ b/tiktok_downloader/data_methods.py
@@ -0,0 +1,123 @@
+import os
+from collections import namedtuple
+from datetime import datetime
+import global_data
+import file_methods
+
+
+Difference = namedtuple("Difference", "new_ids size")
+Total = namedtuple("Total", "total unique")
+
+
+def get_difference(tag, file, ids):
+    maiden_entry = False
+    current_id_data = file_methods.get_data(file)
+    if tag in current_id_data:
+        current_ids = current_id_data[tag]
+        set1 = set(current_ids)
+        set2 = set(ids)
+        new_ids = set2.difference(set1)
+        if new_ids:
+            new_ids = list(new_ids)
+            size = len(new_ids)
+            diff = Difference(new_ids, size)
+            return (diff, maiden_entry)
+        else:
+            return ([], maiden_entry)
+    else:
+        maiden_entry = True
+        return (ids, maiden_entry)
+
+
+def extract_posts(settings, file_name, tag):
+    ids = []
+    posts = []
+    new_posts = []
+
+    posts = file_methods.get_data(file_name)
+    for post in posts:
+        ids.append(post["id"])
+    if not ids:
+        print(f"WARNING: no posts were found for {tag} in the file - {file_name}")
+        return
+   
+    status = file_methods.check_existence(settings["post_ids"], "file")
+    if not status:
+        new_data = (ids, posts)
+        return new_data
+    else:
+        res = get_difference(tag, settings["post_ids"], ids)
+        if res[1]:
+            new_data = (ids, posts)
+            return new_data
+        else:
+            if res[0]:
+                for i in res[0].new_ids:
+                    for post in posts:
+                        if (i == post["id"]):
+                            new_posts.append(post)
+                new_data = (res[0].new_ids, new_posts)
+                return new_data
+            else:
+                print(f"WARNING: No new posts were found in the downloaded file - {file_name}")
+                return
+
+
+def extract_videos(settings, tag, download_list):
+    status = file_methods.check_existence(settings["video_ids"], "file")
+    if not status:
+        new_data = download_list
+        return new_data
+    else:
+        res = get_difference(tag, settings["video_ids"], download_list)
+        if res[1]:
+            return download_list
+        else:
+            if res[0]:
+                new_data = res[0].new_ids
+                return new_data
+            else:
+                print(f"WARNING: No new videos were found for the {tag} in the downloaded folder.")
+                return
+
+
+def update_posts(file_path, file_type, new_data, tag=None):
+    try:
+        status = file_methods.check_existence(file_path, file_type)
+        if not tag:
+            file_methods.post_writer(file_path, new_data, status)
+        else:
+            log = file_methods.id_writer(file_path, new_data, tag, status)
+            return log
+    except:
+        raise
+
+
+def update_videos(settings, new_data, tag):
+    file_path = settings["video_ids"]
+    file_methods.check_file(file_path, "file")
+    log = file_methods.id_writer(file_path, new_data, tag, True)
+    file_methods.clean_video_files(settings, tag, new_data)
+    return log
+
+
+def get_total_posts(file_path, tag):
+    status = file_methods.check_existence(file_path, "file")
+    if not status:
+        raise OSError("{file_path} not found!")
+    else:
+        data = file_methods.get_data(file_path)
+        total = len(data[tag])
+        unique = len(set(data[tag]))
+        total = Total(total, unique)
+        return total
+
+
+def print_total(file_path, tag, data_type):
+    total = get_total_posts(file_path, tag)
+    if (total.total == total.unique):
+        print(f"Total {data_type} for the hashtag {tag} are: {total.total}")
+        return
+    else:
+        print(f"WARNING: out of total {data_type} for the hashtag {tag} {total.total}, only {total.unique} are unique. Something is going wrong...")
+        return
diff --git a/tiktok_downloader/file_methods.py b/tiktok_downloader/file_methods.py
new file mode 100644
index 0000000..915fb31
--- /dev/null
+++ b/tiktok_downloader/file_methods.py
@@ -0,0 +1,202 @@
+import os, json, subprocess
+from datetime import datetime
+import global_data
+import data_methods
+
+
+def create_file(name, file_type):
+    if (file_type == "dir"):
+        os.makedirs(name, mode=0o777)
+    elif (file_type == "file"):
+        with open(name, "w"): pass
+    else:
+        print(f"ERROR: either {file_type} or is not well defined.")
+    return
+
+
+def check_existence(file_path, file_type):
+    if (file_type == "file"):
+        if os.path.isfile(file_path):
+            return True
+        else:
+            return False
+    elif (file_type == "dir"):
+        if os.path.isdir(file_path):
+            return True
+        else:
+            return False
+    else:
+        raise OSError(f"{file_type} has to be a 'dir' or a 'file'!!!")
+
+
+def check_file(file_path, file_type):
+    status = check_existence(file_path, file_type)
+    if not status:
+        create_file(file_path, file_type)    
+
+    return
+
+
+def download_posts(settings, tag):
+    path = os.path.join(settings["data"], tag, settings["posts"])
+    os.chdir(path)
+    try:
+        tiktok_command = f"tiktok-scraper hashtag {tag} -t 'json'" 
+        result = subprocess.run([tiktok_command], capture_output=True, shell=True)
+        if result.stdout:
+            new_file = result.stdout.decode('utf-8').split()[-1]
+            if ("json" in new_file):
+                os.chdir("../../../tiktok_downloader")
+                return new_file 
+            else:
+                print(f"ERROR: Something's wrong with what is returned by tiktok-scraper for the hashtag {tag} - *{new_file}* is not a json file!!!!")
+                os.chdir("../../../tiktok_downloader")
+                return
+        else:
+            os.chdir("../../../tiktok_downloader")
+            print(f"ERROR: No file was downloaded by the tiktok-scraper for the {tag} !!!!")
+            return
+    except: raise
+
+
+
+def download_videos(settings, tag):
+    path = os.path.join(settings["data"], tag, settings["videos"])
+    os.chdir(path)
+    try:
+        # tiktok_command = f"tiktok-scraper hashtag {tag} -n {settings['number_of_videos']} -d" 
+        tiktok_command = f"tiktok-scraper hashtag {tag} -d" 
+        result = subprocess.run([tiktok_command], capture_output=True, shell=True)
+        if result.stdout:
+            downloaded_list_tmp = os.listdir(f"./#{tag}")
+            if downloaded_list_tmp:
+                downloaded_list = []
+                for file in downloaded_list_tmp:
+                    file = file[0:-4]
+                    downloaded_list.append(file)
+                
+                os.chdir("../../../tiktok_downloader")
+                return downloaded_list
+            else:
+                print(f"WARNING: No video files were downloaded for the hashtag {tag}.")
+                os.chdir("../../../tiktok_downloader")
+                subprocess.call(f"rm -rf {settings['videos_delete']}", shell=True)
+        else:
+            os.chdir("../../../tiktok_downloader")
+            print(f"WARNING: Something went wrong with the tiktok-scraper video download for the {tag} !!!!")
+            return
+        
+    except: raise
+
+
+def get_data(file_path):
+    with open(file_path, "r") as f:
+        data = json.load(f)
+        return data
+
+
+def dump_data(file_path, data):
+    with open(file_path, "w") as f:
+        json.dump(data, f)
+        return            
+
+def log_writer(log_data):
+    total = 0
+    try:
+        log_dict = {}
+        for ele in log_data:
+            if ele[0] in log_dict:
+                if ele[1][0] in log_dict[ele[0]]:
+                    log_dict[ele[0]][ele[1][0]] += ele[1][1]
+                else:
+                    log_dict[ele[0]][ele[1][0]] = ele[1][1]
+                total += ele[1][1]
+            else:
+                log_dict[ele[0]] = { ele[1][0] : ele[1][1] }
+                total += ele[1][1]
+
+        logger = global_data.FILES["logger"]
+        now = datetime.now()
+        now_str = now.strftime("%d-%m-%Y %H:%M:%S")
+        status = check_existence(logger, "file")
+        if status:
+            data = get_data(logger)
+            data[now_str] = log_dict
+            dump_data(logger, data)
+        else:
+            data = { now_str : log_dict }
+            dump_data(logger, data)
+        print(f"Successfully logged {total} entries!!!!")
+        return
+    except: raise
+
+
+def id_writer(file_path, new_data, tag, status):
+    try:
+        total = len(new_data)
+        if status:
+            try:
+                data = get_data(file_path)
+                if tag in data:
+                    data[tag] += new_data
+                else:
+                    data[tag]= new_data 
+                dump_data(file_path, data)
+            except json.decoder.JSONDecodeError:
+                data = { tag : new_data }
+                dump_data(file_path, data)
+        else:
+            data = { tag : new_data }
+            dump_data(file_path, data)
+        print(f"SUCCESS - {total} entries added to {file_path}!!!")
+        log_data = (tag, total)
+        return log_data
+    except: raise
+
+
+def post_writer(file_path, new_data, status):
+    try:
+        total = len(new_data)
+        if status:
+            try:
+                data = get_data(file_path)
+                data += new_data
+                dump_data(file_path, data)
+            except json.decoder.JSONDecodeError:
+                data = new_data
+                dump_data(file_path, data)
+        else:
+            data = new_data
+            dump_data(file_path, data)
+        print(f"SUCCESS - {total} entries added to {file_path}!!!")
+        return
+    except: raise
+
+
+def delete_file(file_path, file_type):
+    if not check_existence(file_path, file_type):
+        print(f"ERROR: Attempt to delete failed. {file_path} does not exist!!!")
+    elif (file_type == "file"):
+        os.remove(file_path)
+        print(f"Successfully deleted {file_path}!!!")
+        return
+    elif (file_type == "dir"):
+        os.rmdir(file_path)
+        print(f"Successfully deleted {file_path}!!!")
+        return
+    else:
+        print(f"ERROR: {file_type} needs to be either 'file' or 'dir' !!!")
+        return
+
+
+def clean_video_files(settings, tag, new_data=None):
+    try:
+        if new_data:
+            for file in new_data:
+                settings["videos_from"] = settings['data'] + f"/{tag}/videos/#{tag}/{file}.mp4"
+                subprocess.call(f"mv {settings['videos_from']} {settings['videos_to']}", shell=True)
+             
+        subprocess.call(f"rm -rf {settings['videos_delete']}", shell=True)
+        print(f"Successfully deleted the folder {settings['videos_delete']} folder of videos.")
+    except:
+        raise
diff --git a/tiktok_downloader/global_data.py b/tiktok_downloader/global_data.py
new file mode 100644
index 0000000..767e322
--- /dev/null
+++ b/tiktok_downloader/global_data.py
@@ -0,0 +1,39 @@
+# Directories
+DATA = "../data"
+IDS = "ids"
+LOG = "log"
+POSTS = "posts"
+VIDEOS = "videos"
+IMAGES = f"{DATA}/img"
+
+# Files
+POST_IDS = "post_ids.json"
+VIDEO_IDS = "video_ids.json"
+DATA_FILE = "data.json"
+LOG_FILE = "log.json"
+
+
+FILES = {
+            "data" : DATA,
+            "ids" : IDS,
+            "log" : LOG,
+            "posts" : POSTS,
+            "videos" : VIDEOS,
+            "images" : IMAGES,
+            "post_ids" : f"{DATA}/{IDS}/{POST_IDS}",
+            "video_ids" : f"{DATA}/{IDS}/{VIDEO_IDS}",
+            "data_file" : f"{DATA_FILE}",
+            "downloads" : [],
+            "logger" : f"{DATA}/{LOG}/{LOG_FILE}",
+        }
+
+
+
+# Commands
+tag = ""
+
+PARAMETERS = {
+            "scraper_attempts" : 3,
+#            "number_of_videos" : 3, # Number of videos to be downloaded by tiktok-scraper.
+            "sleep" : 8
+        }
diff --git a/tiktok_downloader/hashtag_list.py b/tiktok_downloader/hashtag_list.py
new file mode 100644
index 0000000..83f38c1
--- /dev/null
+++ b/tiktok_downloader/hashtag_list.py
@@ -0,0 +1,7 @@
+hashtag_list = [
+# This is a sample hashtag list. Please enter your hashtag list (without the comment).
+            "london",
+            "paris",
+            "newyork",
+            "tokyo"
+        ]
diff --git a/tiktok_downloader/run_downloader.py b/tiktok_downloader/run_downloader.py
new file mode 100644
index 0000000..67e58bd
--- /dev/null
+++ b/tiktok_downloader/run_downloader.py
@@ -0,0 +1,213 @@
+import os, sys
+import time
+import json
+import argparse, importlib
+
+import global_data
+import file_methods
+import data_methods
+
+
+
+command = "python3 post_downloader.py "
+
+def get_hashtag_list(file_name):
+    try:
+        f = importlib.import_module(file_name) # exec(f"from {file_name} import hashtag_list")
+        print(f.hashtag_list)
+        return f.hashtag_list
+    except ImportError as error:
+        print("ImportError: " + str(error))
+        print(f"Please provide at least one hashtag either by entering as an argument or by adding hashtags to the variable hashtag_list in the file {file_name}")
+        sys.exit()
+
+
+def create_parser():
+    # Creating the parser
+    parser = argparse.ArgumentParser(description="Download the tiktoks for the requested hashtags")
+
+    # Adding the arguments
+    #parser.add_argument("--h", type=str, nargs="*", required=True, help="List of hashtags")
+    parser.add_argument("--h", type=str, nargs="*", help="List of hashtags")
+    parser.add_argument("-f", type=str, help="File name with the list of hashtags")
+    parser.add_argument("-p", action="store_true", help="Download posts")
+    parser.add_argument("-v", action="store_true", help="Download videos")
+
+    return parser
+
+
+def set_download_settings(download_data_type):
+    settings = {}
+    settings["data"] = global_data.FILES["data"]
+    settings["ids"] = global_data.FILES["ids"]
+    settings["log"] = global_data.FILES["log"]
+    settings["logger"] = global_data.FILES["logger"]
+    settings["sleep"] = global_data.PARAMETERS["sleep"]
+    settings["scraper"] = global_data.PARAMETERS["scraper_attempts"]
+    file_methods.check_file(f"{settings['data']}/{settings['ids']}", "dir")
+    file_methods.check_file(f"{settings['data']}/{settings['log']}", "dir")
+    if download_data_type == "posts":
+        settings["posts"] = global_data.FILES["posts"]
+        settings["post_ids"] = global_data.FILES["post_ids"]
+        settings["data_file"] = global_data.FILES["data_file"]
+        return settings
+    elif download_data_type == "videos":
+        settings["videos"] = global_data.FILES["videos"]
+        settings["video_ids"] = global_data.FILES["video_ids"]
+        return settings
+    elif download_data_type == "posts-videos":
+        settings["posts"] = global_data.FILES["posts"]
+        settings["post_ids"] = global_data.FILES["post_ids"]
+        settings["data_file"] = global_data.FILES["data_file"]
+        settings["videos"] = global_data.FILES["videos"]
+        settings["video_ids"] = global_data.FILES["video_ids"]
+        return settings
+    else:
+        print(f"ERROR: The download_data_type must be either posts, videos or posts-videos.")
+        sys.exit()
+
+
+
+def get_posts(settings, tag):
+    file_path = file_methods.download_posts(settings, tag)
+    log = ()
+    if file_path:
+        new_data = data_methods.extract_posts(settings, file_path, tag)
+        if new_data:
+            data_file = os.path.join(settings["data"], tag, settings["posts"], settings["data_file"])
+            data_methods.update_posts(data_file, "file", new_data[1])
+            log = data_methods.update_posts(settings["post_ids"], "file", new_data[0], tag)
+        file_methods.delete_file(file_path, "file")
+    
+    return log
+
+
+
+def get_videos(settings, tag):    
+    log = ()
+    download_list = file_methods.download_videos(settings, tag)
+    if download_list:
+        new_data = data_methods.extract_videos(settings, tag, download_list)
+        if new_data:
+            log = data_methods.update_videos(settings, new_data, tag)
+        else:
+            file_methods.clean_video_files(settings, tag)
+
+    return log
+
+
+
+def get_data(hashtags, download_data_type):
+    counter = 0
+    total_hashtags = len(hashtags)
+    total_hashtags_offset = total_hashtags - 1
+    log_data = []
+    
+    if download_data_type == "posts":
+        settings = set_download_settings(download_data_type)
+        while counter < total_hashtags:
+            tag = hashtags[counter]
+            file_methods.check_file(os.path.join(settings["data"], tag, settings["posts"]), "dir")
+            file_methods.check_file(os.path.join(settings["data"], tag, settings["posts"], settings["data_file"]), "file")
+            res = get_posts(settings, tag)
+            if res:
+                log = ( res[0], ( "posts", res[1] ) )
+                log_data.append(log)
+                data_methods.print_total(settings["post_ids"], tag, download_data_type)
+            
+            counter += 1
+            if counter < total_hashtags_offset:
+                time.sleep(settings["sleep"])
+    elif download_data_type == "videos":
+        settings = set_download_settings(download_data_type)
+        while counter < total_hashtags:
+            tag = hashtags[counter]
+            file_methods.check_file(os.path.join(settings["data"], tag, settings["videos"]), "dir")
+            settings["videos_delete"] = settings['data'] + f"/{tag}/videos/#{tag}"
+            settings["videos_to"] = settings['data'] + f"/{tag}/videos"
+            res = get_videos(settings, tag)
+            if res:
+                res = ( res[0], ( "videos", res[1]))
+                log_data.append(res)
+                data_methods.print_total(settings["video_ids"], tag, download_data_type)
+ 
+            counter += 1
+            if counter < total_hashtags_offset:
+                time.sleep(settings["sleep"])
+    elif download_data_type == "posts-videos":
+        settings = set_download_settings(download_data_type)
+        while counter < total_hashtags:
+            tag = hashtags[counter]
+            file_methods.check_file(os.path.join(settings["data"], tag, settings["posts"]), "dir")
+            file_methods.check_file(os.path.join(settings["data"], tag, settings["posts"], settings["data_file"]), "file")
+            file_methods.check_file(os.path.join(settings["data"], tag, settings["videos"]), "dir")
+            settings["videos_delete"] = settings['data'] + f"/{tag}/videos/#{tag}"
+            settings["videos_to"] = settings['data'] + f"/{tag}/videos"
+            requests = [("posts", "post_ids", get_posts), ("videos", "video_ids", get_videos)]
+            total_reqs_offset = len(requests) - 1
+            req_counter = 0
+            for req in requests:
+                res = req[2](settings, tag)
+                if res:
+                    res = ( res[0], (req[0], res[1]) )
+                    log_data.append(res)
+                    data_methods.print_total(settings[req[1]], tag, req[0])
+                
+                if req_counter < total_reqs_offset:
+                    time.sleep(settings["sleep"])
+                    req_counter += 1
+
+            counter += 1
+            if counter < total_hashtags_offset:
+                time.sleep(settings["sleep"])
+    else:
+        print(f"ERROR: The download_data_type must be either posts, videos or posts-videos.")
+        sys.exit()
+    return log_data
+
+
+def get_hashtags(file_name, hashtag_list):
+    try:
+        from hashtag_list import hashtag_list
+        return hashtag_list
+    except:
+        print(f"ERROR: something went wrong while reading the file {file_name}!")
+        raise
+
+
+if __name__ == "__main__":
+    parser = create_parser()
+    args = parser.parse_args()
+
+    if not (args.h or args.f):
+        parser.error("No hashtags were given, please use either --h option or -f to provide hashtags.")
+        sys.exit()
+    
+    if not (args.p or args.v):
+        parser.error("No argument given, please specify either -p for posts or -v videos or both.")
+        sys.exit()
+
+    if args.h:
+        hashtags = args.h
+    elif args.f:
+        file_name = args.f
+        hashtags = get_hashtag_list(file_name)
+
+    print(hashtags)
+    if not hashtags:
+        print("No hashtags were given, please use either --h option or -f to provide hashtags.")
+        sys.exit(0)
+
+    if (args.p and args.v):
+        download_data_type = "posts-videos"
+    elif args.p:
+        download_data_type = "posts"
+    else:
+        download_data_type = "videos"
+   
+    try: 
+        log_data = get_data(hashtags, download_data_type)
+        if log_data:
+            file_methods.log_writer(log_data)
+    except:
+        raise