fen0x / marvin Goto Github PK

Un bot per l'integrazione fra il gruppo Telegram e il subreddit /r/ItalyInformatica

Home Page: https://reddit.com/r/ItalyInformatica

License: MIT License

Python 100.00%

marvin's Introduction

marvin

Questo bot pubblica tutti i link postati sul gruppo Telegram ItalyInformatica (https://t.me/ItalyInformatica) sul subreddit a cui fa riferimento (https://www.reddit.com/r/ItalyInformatica/).

Il bot deve:

su comando /postlink, in risposta ad un messaggio contenente un link, postare tale link sul subreddit, indicando il nick Telegram dell'autore;
su comando /posttext, in risposta ad un messaggio testuale, postare tale contenuto sul subreddit con il titolo fornito, indicando il nick Telegram dell'autore;
su comando /comment, in risposta ad un messaggio contenente un link ad un post di Reddit (solo se del subreddit ItalyInformatica), aggiungere un commento al post;
su comando /delrule, in risposta ad un messaggio contenente un link ad un post di Reddit (solo se del subreddit ItalyInformatica), cancellare tale post per violazione della regola fornita.

Wiki completa delle funzionalità: https://old.reddit.com/r/ItalyInformatica/wiki/bot

marvin's People

Contributors

Stargazers

Watchers

Forkers

marlowess giorgioprevitera kalugen pitasi defkon1 drizzt vash404 zelirian

marvin's Issues

Scrivere chi ha eseguito una certa azione nel messaggio di risposta del bot

esempio:
Delooo, Il tuo commento è stato aggiunto al post!

Ban automatico di cryptocurrency spam bot

Sempre più bot entrano nel canale solamente per postare link di spam/phishing relativi a qualche sito malevolo che ha a che fare con qualche cryptocurrency. Esempio più comune: una foto seguita da un link che il è spesso nel formato http[s]://t.cn/... o http[s]://tinyurl.com....

La quantità di bot di questo genere sembra essere non insignificante e suppongo che sia difficile e noioso gestire a mano la cosa. L'aggiunta al bot di una funzionalità di controllo dei messaggi dei nuovi utenti ed eventuale ban istantaneo dei bot sarebbe una ottima feature.

Come funzionano gli spam bot

Un bot del genere solitamente opera così:

Entra nel gruppo, ed aspetta un po' (minuti, secondi).
Invia nel gruppo una foto apparentemente normale.
Invia nel gruppo un messaggio contenente testo casuale.
Modifica la foto nel messaggio del punto 2 cambiandola con una foto contenente spam, come mostrato sopra.
Modifica il testo del messaggio del punto 3 cambiandolo con un link di spam/phishing, come mostrato sopra.

I punti 2, 3, 4, 5 sono più o meno interscambiabili a patto che ovviamente 2 avvenga prima di 4 e 3 avvenga prima di 5.

Come contrastarli

Non conosco la API fornita dalla specifica libreria Python utilizzata in questo bot, ma conosco la API Telegram, quindi parlerò basandomi sulla seconda. La libreria Python utilizzata dice di supportare completamente la Telegram Bot API 4.1, quindi il modo di fare quel che dico dovrebbe esserci, e non dovrebbe neanche essere difficile da capire.

Cosa andrebbe fatto:

Ogni messaggio ricevuto, controllare il campo new_chat_members dell'oggetto Message, aggiungendo l'ID di tutti i nuovi utenti ad un set di watchlist. Gli utenti in questo set avranno associato un contatore del numero di messaggi inviati nel gruppo (inizialmente settato a zero) ed una data dell'ultima interazione (inizialmente settata al momento di entrata nel gruppo).
Ogni messaggio ricevuto, controllare se il messaggio è stato inviato da uno degli utenti nel set di watchlist.
Se l'utente è nel set:

3.1. Incrementare il contatore: se il contatore supera una certa soglia (direi >= 3), eliminare l'utente dalla watchlist. I bot solitamente inviano i primi due messaggi contenenti spam, poi basta.

3.2. Se è passato abbastanza tempo dall'ultima interazione (1h? 3h? da definire), eliminare l'utente dalla watchlist. I bot solitamente operano nel giro di pochi minuti/secondi di tempo dall'entrata nel gruppo.

3.3. Se il messaggio contiene una foto (campo photo), una possibile azione potrebbe essere il ban istantaneo (e rimozione da watchlist), inviando poi un messaggio privato di default all'utente spiegando il motivo del ban. Nessuno invia foto appena entrato in un gruppo, questo potrebbe essere un buon metodo di riconoscere bot.

3.4. Se il messaggio contiene del testo (campo text), controllare il testo per URL della forma http[s]://t.cn/... o http[s]://tinyurl.com... ed in tal caso bannare l'utente allo stesso modo del punto 3.3 (e rimuovere da watchlist).

3.5. Se il messaggio contiene una edit di una photo (campo new_chat_photo), stessa azione del punto 3.3.

3.6. Se il messaggio è una edit del testo (campo edit_date diverso da date), stessa azione del punto 3.4.
In ogni caso, è necessario avere una seconda funzione che controlli gli utenti nella watchlist ogni TOT ed elimini dalla watchlist gli utenti che hanno una ultima interazione abbastanza vecchia, così da non riempire la watchlist (e quindi anche la RAM) di utenti che sono nel gruppo solo per leggere e non mandano messaggi. Questo potrebbe essere aggiunto all'handler dei messaggi di default.

Filtrare (al meglio delle possibilità) i messaggi con contenuti discutibili postati da telegram a reddit

Non fare reply telegram nel messaggio "post creato"

Nel caso dell'immagine, il bot risponde a qualcosa che il bot stesso cancella, lasciando uno spazio inutile. Non ha senso che il bot risponda a quel messaggio se appunto è lui stesso a cancellarlo, è meglio che sia un messaggio normale allora, senza essere una risposta ad un messaggio. Oppure potrebbe essere una reply al messaggio di partenza, quello al quale ha fatto reply anche chi ha scritto /postlink o /posttext

Aggiungere un comando che approvi un post sul subreddit

Al contrario di /delrule, questo comando dovrebbe, in risposta ad un link sul subreddit, approvare il post e aggiungere un tag fra quelli disponibili nel sub.

Un esempio di sintassi potrebbe essere:
/approve programmazione

Permettere a tutti gli utenti di commentare un post

(Basta togliere l'if dalla funzione comment)

Rimuovere auto-tag dal comando /admin

Il bot tagga se stesso col comando /admin perché prova ad inviarsi un messaggio privato e Telegram glielo impedisce.

Disponibilità per tutti dei comandi /postlink e /posttext

Alla fine non credo che ci sarebbero grandi abusi e comunque si possono sempre moderare.

Sostituire IFTTT come stream dei nuovi post sul subreddit

Il bot dovrebbe potere rilevare i nuovi post sul subreddit e, in maniera temporizzata, riportarne il link sul gruppo telegram, magari escludendo quelli che sono stati postati dal gruppo stesso.

Quando viene postato un video youtube con /postlink, il titolo del post è "Youtube" e non il titolo del video

Associazione fra nome utente telegram e reddit

Tramite un comando sul gruppo telegram (ipotizzo /linkuser nomeutentereddit) il bot richiederebbe il permesso di postare contenuti al posto dell'utente, potendo così sottomettere a nome dell'utente reddit associato.

/comment permette di commentare anche i post cancellati

Come si può vedere, seppure l'app slide (client non ufficiale di reddit) mi dice che non potrei commentare, e non me lo fa fare, il bot lo può fare e quindi da telegram si bypassa il limite di reddit

Eliminare il messaggio di cancellazione del post (o girarlo solo sul gruppo di controllo)

A seguito del comando /delrule, il bot dovrebbe evitare di avvisare sul gruppo principale che il post è stato eliminato. Per logging, potrebbe comunque farlo sul gruppo di controllo dei mod.

Permettere il comando delrule anche dal gruppo di logging

Non è bello dare comandi di cancellazione di post in un gruppo pubblico. Non si potrebbe fare nella privacy del gruppo di logging dei post?

Post nel gruppo telegram degli issue (o pr) aperti su questa repo

Se qualcuno apre una issue (o una pr) su questa repo, sarebbe carino si inviasse un messaggio nel gruppo telegram, di modo da renderne partecipi tutti

Implementare un meccanismo di antiflood parametrizzabile

Controllare la validità di un commento

Il comando /comment accetta come parametro anche tutti spazi.

Esempio:

https://www.reddit.com/r/ItalyInformatica/comments/bmb98w/hackers_steal_40m_in_bitcoin_from_binance/emwfcli?utm_source=share&utm_medium=web2x

All'ingresso di un nuovo utente nel gruppo, il bot dovrebbe postare un messaggio di benvenuto

Bloccare l'utilizzo del comando ai mod di uno specifico gruppo

Il bot in questo caso sarà utilizzato dai mod del gruppo telegram di ItalyInformatica, fare in modo che solo loro possano utilizzare il bot (quindi non deve essere possibile utilizzarlo in privato o utilizzarlo aggiungendolo ad un altro gruppo)

Risposta di default al comando /admin

Quando si usa /admin, se il bot è riuscito a contattare tutti gli admin in privato, dovrebbe comunque confermare all'utente che il comando è andato a buon fine

Precedenza al controllo se moderatore

Nel controllo se un comando può essere eseguito, andrebbe data la precedenza a quello se un utente è moderatore. Altrimenti gli utenti si prendono messaggi di errore che, da un punto di vista formale, non sono corretti.

In questo caso il bot avrebbe dovuto rispondere che non è moderatore e non che deve rispondere ad un messaggio.

Aggiungere il link (telegram) del testo da cui proviene il post (su reddit) e altre cosette

Se io scrivo "ciao" su telegram, e qualcuno ci fa /posttext, esso viene pubblicato
Il post su reddit conterrà "ciao".

Io invece propongo di aggiungere, sul fondo, una dicitura del tipo
"questo post proviene da telegram grazie al bot marvin"
dove

la parola "telegram" sarà un link diretto al messaggio dal gruppo telegram https://t.me/ItalyInformatica/1234 (dove 1234 è il numero [message_id] del messaggio postato)
la parola "marvin" avrà un link a questa repo di github

Stampare un errore in caso di utilizzo errato del comando

Se un utente scrive solo /postalink stampare un errore adatto
Come:"Solo i mod possono usare questo comando"
E anche:"Per utilizzare questo comando devi rispondere ad un messaggio"

Il messaggio di elminazione del post non viene postato nel gruppo di controllo

Il messaggio di errore è il seguente:

2019-05-05 16:43:16,795 - __main__ - WARNING -
Update status:
"{'message': {'delete_chat_photo': False, 'new_chat_photo': [], 'text': '/delrule 6', 'reply_to_message': {'delete_chat_photo': False, 'new_chat_photo': [], 'text': 'Cercasi Scripter per progetto Italiano FIVEM RP\nhttps://redd.it/bkygo5', 'supergroup_chat_created': False, 'photo': [], 'new_chat_members': [], 'channel_chat_created': False, 'message_id': 488417, 'entities': [{'length': 22, 'offset': 48, 'type': 'url'}], 'chat': {'username': 'ItalyInformatica', 'title': '/r/ItalyInformatica', 'id': -1001076982426, 'type': 'supergroup'}, 'from': {'first_name': 'bifrost|bot', 'is_bot': True, 'id': 706670142, 'username': 'bifrost_robot'}, 'group_chat_created': False, 'date': 1557067311, 'caption_entities': []}, 'photo': [], 'new_chat_members': [], 'channel_chat_created': False, 'message_id': 488418, 'entities': [{'length': 8, 'offset': 0, 'type': 'bot_command'}], 'chat': {'username': 'ItalyInformatica', 'title': '/r/ItalyInformatica', 'id': -1001076982426, 'type': 'supergroup'}, 'from': {'first_name': 'Fen0x', 'is_bot': False, 'id': 117903015, 'username': 'Fen0x'}, 'supergroup_chat_created': False, 'group_chat_created': False, 'date': 1557067391, 'caption_entities': []}, 'update_id': 333249479}"
Caused error:
"Reply message not found"

Implementazione comando di richiamo agli admin

/admin contatterà in privato gli amministratori oppure li taggherà nel gruppo #64

Post in formato testo

Nel caso il messaggio su cui si fa la richiesta non contenga un link, il bot deve richiedere un titolo e sottometterà al sub un post in formato testuale

Sistemare /delrule

Il commento di cancellazione del post va fatto mod e sticky
Testare a fondo il comando per vedere se effettivamente funziona bene cancellando i messaggi telegram

Aggiungere un link al commento telegram nel tag di un commento postato con il commando /comment

Ora il formato del commento postato con il comando /comment è questo:

[Telegram - @nomeutente] commento

Dovrebbe diventare (in formato markdown):

[[Telegram](link al commento) - @nomeutente] commento

Modifica dei commenti

Possibilità di modificare un commento postato dal gruppo al subreddit

Cambiare il carattere di inizio del comando

Attualmente il carattere iniziale è '/'
esempio: /postlink

Sfortunatamente, quello è il carattere dei veri comandi di telegram. Il bot che usiamo per moderare il gruppo, ha la possibilità di cancellare all'istante i comandi che non riconosce. Ovviamente /postlink non lo riconosce.
Questa funzionalità è molto comoda, e non bisogna perderla. Il bot admin è talmente veloce che cancella /postlink prima che possa essere visto dal bot marvin.

Per ora, ho spento la cancellazione dei comandi.

Tuttavia, con questa segnalazione, diciamo anche che possiamo considerarla un mezzo bug, chiedo di scegliere un nuovo carattere.

Suggerisco qualcosa come

+postlink
-postlink
=postlink
$postlink
&postlink
%postlink

ecc...

Sono sicuro che questi il bot li cancella
/ ! # .
Slash, punto esclamativo, cancelletto, punto

Discutiamo insieme su quale carattere è giusto scegliere (ovviamente va bene anche un altro rispetto a quelli che ho proposto io)

Comando /delrule [numero]

Rispondendo ad link postato dal bot (quindi un post del subreddit postato direttamente da reddit) con il comando, ad esempio /delrule 1, il bot commenta che viola la regola 1 (e magari scrive anche la regola (vedi commento d'esempio https://www.reddit.com/r/ItalyInformatica/comments/al305w/semplice_crm_per_consulente/efa79k6/), il bot poi cancella il post, e elimina anche il comando /delrule del gruppo e il post sul gruppo telegram al quale si aveva risposto con /delrule. Il bot blocca anche i commenti al post di reddit appena cancellato (su questo non saprei, deciderà fen0x)

Spero di essermi spiegato bene.
Sostanzialmente riduce molto lavoro a fen0x

Sostituire IFTTT per il posting su Twitter e Facebook

Ora esistono un paio di automatismi creati su IFTTT che, quando rilevano un nuovo post sul subreddit, postano sulla pagina FB e sull'account Twitter.
https://www.facebook.com/rItalyInformatica/
https://twitter.com/ItalyITC
Sarebbe bello che fosse il bot stesso a provvedere e a permettere la cancellazione di tali post sempre con il comando /delrule.

Commenti per qualsiasi link al subreddit

Il comando /comment dovrebbe essere in grado di inviare un commento a qualsiasi link al subreddit che appare sul gruppo telegram.

Il testo postato con il comando /comment dovrebbe essere interpretato come markdown

Esempio:

https://www.reddit.com/r/ItalyInformatica/comments/bj1j3t/consigli_su_manualidocumentazionisiti_per/em4m0wl/

Aggiungere un parametro nel comando postlink per inserire nel titolo anche un tag per la lingua

Come da best practice per il posting sul subreddit, se il link è in inglese sarebbe buona norma inserire nel titolo un tag [ENG].
https://www.reddit.com/r/ItalyInformatica/wiki/guidelines

Il commento di rimozione di un post rimosso tramite link, riporta il link nel commento

Se viene dato il comando /delrule <link al post> <numero della regola>, il commento di rimozione include erroneamente anche il link al post.

Esempio: https://www.reddit.com/r/ItalyInformatica/comments/jqu7a1/impossibile_accedere_a_xboxlive_per_pc/

Il bot smette di creare le notifiche di nuovi post sul sub

Il log prima del restart

2019-01-29 19:08:16,074 - __main__ - INFO - Starting bot... Reading login Token...
2019-01-29 19:08:16,075 - __main__ - INFO - Unable to load cached cookies, creating new ones automatically.
2019-01-29 19:08:17,437 - __main__ - INFO - Connecting to subreddit:ItalyInformatica - ItalyInformatica: Il panorama informatico italiano
2019-01-29 19:08:17,438 - __main__ - INFO - Starting bot... Logging in...
2019-01-29 19:08:17,439 - __main__ - INFO - Starting bot... Setting handler...
2019-01-29 19:08:17,441 - __main__ - INFO - check_new_reddit_posts thread started
2019-01-29 19:08:17,441 - __main__ - INFO - Starting bot... Bot ready!
2019-01-30 09:48:06,429 - __main__ - WARNING - Update "{'update_id': 333239450, 'message': {'channel_chat_created': False, 'supergroup_chat_created': False, 'new_chat_photo': [], 'reply_to_message': {'channel_chat_created': False, 'new_chat_photo': [], 'text': 'Sviluppo Bot telegram\nhttps://redd.it/alasda', 'new_chat_members': [], 'delete_chat_photo': False, 'photo': [], 'entities': [{'offset': 22, 'type': 'url', 'length': 22}], 'caption_entities': [], 'message_id': 478011, 'from': {'username': 'bifrost_robot', 'id': 706670142, 'first_name': 'bifrost|bot', 'is_bot': True}, 'date': 1548837756, 'group_chat_created': False, 'supergroup_chat_created': False, 'chat': {'username': 'ItalyInformatica', 'id': -1001076982426, 'type': 'supergroup', 'title': '/r/ItalyInformatica'}}, 'text': '/comment puoi connetterti ad un db MSSQL e salvare la pagina corrente di ogni utente, oppure puoi usare delle variabili (che però devi salvare da qualche parte per non perderle quando lo riavvii)', 'new_chat_members': [], 'delete_chat_photo': False, 'photo': [], 'entities': [{'offset': 0, 'type': 'bot_command', 'length': 8}], 'caption_entities': [], 'chat': {'username': 'ItalyInformatica', 'id': -1001076982426, 'type': 'supergroup', 'title': '/r/ItalyInformatica'}, 'from': {'username': 'Delooo', 'id': 340271798, 'first_name': '𝑳𝒖𝒄𝒂 {...}', 'is_bot': False}, 'date': 1548838085, 'group_chat_created': False, 'message_id': 478012}}" caused error "Reply message not found"
2019-01-30 15:30:10,078 - __main__ - INFO - Default comment sent!
2019-01-30 15:30:10,134 - __main__ - INFO - New text-post submitted
2019-01-30 18:04:40,361 - __main__ - INFO - Comment added to post with id:aldrfg
2019-01-31 11:30:56,873 - __main__ - INFO - Comment added to post with id:alndq4
2019-02-01 08:25:51,679 - __main__ - INFO - Default comment sent!
2019-02-01 08:25:51,774 - __main__ - INFO - New text-post submitted
2019-02-01 09:56:26,840 - __main__ - INFO - Default comment sent!
2019-02-01 09:56:26,919 - __main__ - INFO - New link-post submitted

Il messaggio linkato nel commento di reddit è sbagliato

https://www.reddit.com/r/ItalyInformatica/comments/an4d4x/telegram_leo_1098_da_feed_rss_a_canale_telegram/efql8ph/

Dovrebbe essere il messaggio di partenza, non il comando di fen0x

Autorizzazioni separate per diversi ambiti

I moderatori del gruppo telegram, se non sono moderatori del subreddit, non dovrebbero avere la possibilità di utilizzare il comando /delrule.

Non inoltrare post più vecchi di un TOT da reddit

Ciao,
attualmente il bot inoltra sul gruppo Telegram anche post reddit vecchi (20 giorni?).
Consiglio di mettere un blocco per cui il bot non inoltra niente che sia più vecchio di un TOT numero (da decidere) di ore.

La funzione get_page_title_from_url sembra non andare

In un test effettuato oggi in locale il bot non riusciva a scaricare i titoli delle pagine

Controllare se la funzione "get_page_title_from_url" funziona come dovrebbe

marvin/marvin.py

Line 19 in 9d926f0

def get_page_title_from_url(page_url: str):

Suggerimento: comando per creare suggerimenti dal gruppo telegram per migliorare il bot

L'idea è un thread in cui vengono pubblicati come commenti di un post su reddit magari

I comandi dovrebbero essere riconosciuti solo se seguiti da uno spazio

I comandi riconoscono il parametro anche se non è separato da uno spazio.

Esempio:

https://www.reddit.com/r/ItalyInformatica/comments/bmb98w/hackers_steal_40m_in_bitcoin_from_binance/emwdunt/

lockare/rimuovere il commento
lockare le risposte
rispondere con: "Il tuo post è stato rimosso per la violazione del seguente articolo del regolamento: "

Ha un funzionamento simile a /delrule

Il nome utente riportato dovrebbe essere quello dell'autore

Nel post sul subreddit viene riportato il nome utente di chi ha dato il comando e non quello dell'utente che ha creato il messaggio contenente il link

Fissare su telegram alcuni tipi di post

Con un json si tiene traccia delle parole che compaiono del titolo e della lista dei possibili autori, se un post rientra in queste caratteristiche, viene pinnato:
esempio:
https://www.reddit.com/r/ItalyInformatica/comments/amytg7/il_mercatino_digitale_consigli_per_hardware/
Avrebbe testo "mercatino digitale" e utenti "automoderator"

fen0x / marvin Goto Github PK

marvin's Introduction

marvin

marvin's People

Contributors

Stargazers

Watchers

Forkers

marvin's Issues

Come funzionano gli spam bot

Come contrastarli

Recommend Projects

Recommend Topics

Recommend Org