Safernet apresenta índice de palavras que ajudará o mundo a combater produção e difusão de imagens de abuso sexual infantil

Crimes na Web

Safernet apresenta índice de palavras que ajudará o mundo a combater produção e difusão de imagens de abuso sexual infantil

Compartilhar
ONG brasileira mostrou em Paris o primeiro conjunto de dados do projeto Discover; denúncias de imagens de abuso sexual infantil registram aumento de 79% nos 10 primeiros meses de 2023

A ONG brasileira Safernet Brasil apresentou em Paris no último dia 8 de novembro o primeiro conjunto de dados do projeto Discover, de desenvolvimento de tecnologias de prevenção ao abuso sexual infantil online. 

Trata-se de um conjunto de 963 palavras-chave em português, inglês e acrônimos (siglas, abreviações, palavras codificadas ou com erros propositais de ortografia ou digitação) usadas por predadores sexuais ao organizar, divulgar, compartilhar ou trocar imagens de abuso e exploração sexual infantil e ou na tentativa de aliciar crianças e adolescentes a produzirem esses conteúdos. 

O conjunto de palavras-chave foi pesquisado pela Safernet num universo de 100 mil textos associados a páginas e conteúdos com imagens de abuso e exploração sexual infantil em páginas denunciadas à ONG. 

“Esses 963 termos foram coletados durante o processamento das denúncias de imagens de abuso e exploração sexual infantil realizadas pela Safernet no Brasil ao longo dos últimos anos. Essa indexação faz parte do Projeto Discover, e nosso objetivo é que possa ser aproveitado pela comunidade internacional”, explica o presidente da Safernet, Thiago Tavares. 

O projeto Discover, da Safernet, é financiado pelo fundo SafeOnline. A Safernet foi uma das vencedoras de um edital da organização em 2021 e tornou-se a primeira instituição latino-americana a obter recursos desse fundo. 

Apresentação em Paris

As palavras-chave foram apresentadas por Tavares em reunião técnica de especialistas do mundo todo, convidados pelo fundo SafeOnline, We Protect e Governo Francês, em uma das oficinas do evento “Safe digital futures for children: data for change” (“Futuros digitais seguros para crianças: (uso de) dados para a mudança”, realizado nos dias 8 e 9 de novembro, na capital francesa. 

A SafeOnline, We Protect e o Governo Francês lançaram durante o evento a iniciativa Laboratório para a Proteção da Criança Online

No Brasil, a cada hora 6 crianças ou adolescentes são vítimas de violência sexual (Fórum Brasileiro de Segurança Pública, 2023) e 1 em cada 7 crianças em idade escolar no Brasil sofreu algum tipo de abuso sexual em sua vida (Pesquisa Pense, IBGE, 2019). No Brasil, 92% das crianças entre 9 e 17 anos usam a Internet todos os dias, e essas crianças estão passando cada vez mais tempo conectadas e têm acesso cada vez mais cedo a diferentes dispositivos, geralmente sem supervisão dos pais, conforme demonstrado pela pesquisa Tic Kids Online 2023 (CETIC.br).

Como as palavras ajudarão a detectar conteúdo criminoso?

Usando as palavras-chaves, a indústria, autoridades e pesquisadores selecionados poderão treinar algoritmos de aprendizado por máquinas (machine learning), e aperfeiçoar sistemas de detecção baseados em heurísticas de busca por esses termos. Somadas, essas medidas ajudarão na detecção de conteúdos ilegais e de seus propagadores. O trabalho realizado em busca de imagens ilegais contribuirá para que vítimas também sejam localizadas e identificadas de forma mais rápida, agilizando o combate ao abuso e à exploração sexual no Brasil e em outros países. 

Por conceito, heurísticas são padrões comuns de texto ou palavras-chave que podem ser típicos de uma determinada categoria de violação de política.

Conteúdos detectados por heurísticas geralmente são revisados por moderadores de conteúdo humanos antes que uma ação seja tomada sobre o conteúdo. Heurísticas são tipicamente utilizadas para permitir que as plataformas reajam rapidamente a novas formas de violações que surgem online, incluindo novas formas de disseminação de imagens de abuso e exploração sexual infantil. 

“Sem conjuntos de dados de treinamento abrangentes, ricos e diversos construídos a partir de fontes em diferentes idiomas, as plataformas podem se tornar cegas e comprometer sua capacidade de sinalizar conteúdo para revisão humana e priorizar a ordem que tal conteúdo é revisado durante o processo de moderação”, afirma Tavares. 

Apresentação feita pela Safernet em Paris 

Denúncias de imagens de abuso sexual no Brasil aumentaram 79% nos últimos 10 meses

O número de denúncias novas (links nunca antes reportados e não duplicados) com imagens de abuso e exploração sexual infantil aumentou 78,93% nos primeiros dez meses deste ano em relação ao mesmo período do ano passado. A Safernet recebeu 60.765 novos links entre 1 de janeiro e 31 de outubro deste ano contra 33.961 links no mesmo período de 2022. 

O número de links inéditos recebidos pela Safernet nestes 10 meses de 2023 já supera os 40.572 links inéditos recebidos durante todo o ano de 2022 na Central Nacional de Denúncias, mantida pela Safernet, que recebe denúncias de 10 diferentes crimes contra os direitos humanos na internet. 

No total, ano passado, a Safernet recebeu 111.929 denúncias, um crescimento de quase 10% em relação às 101.833 de 2021. O patamar superior a 100 mil denúncias por dois anos seguidos não era atingido desde 2011. O total de denúncias é a soma dos links inéditos, separados e enviados às autoridades, mais os links duplicados.

#18N Dia Mundial de Prevenção e Reparação ao Abuso e à Exploração Sexual Infantil

A Safernet está divulgando esta nova etapa do projeto Discover e a parcial sobre denúncias de imagens de abuso sexual para chamar a atenção para o Dia Mundial de Prevenção e Reparação ao Abuso e à Exploração Sexual Infantil que deve ser celebrado anualmente dia 18 de novembro. A data foi estabelecida pela Assembleia Geral da ONU em 2022.

Segundo a entidade End Violence Against Children (Fim da Violência contra As Crianças), uma parceria global lançada pelo secretário geral da ONU em 2016, a data apresenta uma oportunidade de “reconhecer a terrível magnitude da violência sexual contra crianças, ampliar o apoio aos sobreviventes e convocar coletivamente lideranças em todos os lugares para se comprometerem com mudanças duradouras em todo o mundo”.

Sobre a Safernet

A Safernet existe desde 2005 e tornou-se a ONG brasileira de referência na promoção dos direitos humanos na internet. Com uma abordagem multissetorial, atua no combate a crimes cibernéticos contra os Direitos Humanos, no acolhimento de vítimas de violência online e em programas de educação, prevenção e conscientização. A Safernet mantém a Central Nacional de Denúncias, conveniada ao Ministério Público Federal e o Canal de Ajuda, o Helpline, para vítimas de violência e outros problemas online. A Safernet promove o uso seguro da internet com projetos educacionais como a Disciplina de Cidadania Digital e o programa Cidadão Digital. 

Importante: a Safernet recomenda que não se deve mais usar a expressão pornografia infantil

Matéria publicada em 17/11/2023

MATERIAL DE APOIO 

Fala inicial de Thiago Tavares no evento de 8 de novembro de 2023

Mesdames et Messieurs,

Je vous remercie beaucoup de m'avoir accueilli ici. Je suis le fondateur et président de SaferNet Brésil. Pour ceux qui ne connaissent pas, SaferNet est la première ONG au Brésil à établir une approche multipartite pour protéger les droits des enfants dans l'environnement numérique. Depuis 2005, nous avons créé et coordonné la ligne d'urgence nationale Cybertipline, la ligne d'aide nationale et le Hub brésilien pour l'éducation et la sensibilisation à la sécurité en ligne. Nous avons 18 ans d'expérience dans la mise en œuvre de programmes innovants et primés avec un énorme impact social au Brésil.

Au cours des 17 dernières années, notre hotline a traité 1 million de signalements uniques, dont plus de 50 % sont liés à la CSAM*. Plus de 700 mille contenus ont été supprimés.

Au Brésil, toutes les heures, 6 enfants ou adolescents sont victimes de violence sexuelle. 1 enfant d'âge scolaire brésilien sur 7 a subi une forme d'abus sexuel au cours de sa vie. Au Brésil, 92 % des enfants âgés de 9 à 17 ans utilisent Internet tous les jours, et ces enfants passent de plus en plus de temps connectés et ont de plus en plus tôt accès à différents appareils, généralement sans la supervision des parents.

Vous pouvez naviguer à travers les statistiques de notre hotline en utilisant un tableau de bord qui est publiquement disponible sur indicadores.safernet.org.br et approfondir ces chiffres.

Financé par SafeOnline, SaferNet gère le projet Discover au Brésil dans le but de créer un bac à sable pour les chercheurs, de construire de nouveaux ensembles de données d'entraînement en langue portugaise et de permettre à des partenaires de confiance de développer des recherches contextuelles et basées sur des preuves interplateformes pour favoriser le développement de nouveaux prototypes open-source pour lutter contre la CSAM en ligne.

Le projet permettra aux développeurs et aux chercheurs de D.I.S.C.O.V.E.R les comportements des délinquants et de mitiger leurs tentatives d'abus au Brésil et dans d'autres pays lusophones. Le modèle de données comprend des détails sur des entités telles que les URL, les noms de domaine, les textes, les mots-clés, les rapports et divers attributs liés à ces rapports.

Comme nous le savons, les plateformes utilisent une combinaison d'heuristiques et d'algorithmes d'apprentissage automatique pour détecter automatiquement le contenu qui viole leurs règles et appliquer les politiques.

Par définition, les heuristiques sont des modèles courants de texte ou de mots-clés qui peuvent être typiques d'une certaine catégorie de violation de politique.

Les contenus détectés par les heuristiques sont généralement examinés par des modérateurs de contenu humains avant qu'une action soit prise sur le contenu. Les heuristiques sont généralement utilisées pour permettre aux plateformes de réagir rapidement aux nouvelles formes de violations qui émergent en ligne, y compris les nouvelles formes de diffusion de la CSAM.

Sans ensembles de données d'entraînement complets, riches et diversifiés construits à partir de sources dans différentes langues, les plateformes peuvent devenir aveugles et compromettre leur capacité à marquer le contenu pour révision humaine et à prioriser l'ordre dans lequel ce contenu est examiné pendant le processus de modération.

Pour collaborer avec la communauté SafeOnline qui travaille dur pour combler cette lacune, je suis ravi d'annoncer que nous lançons aujourd'hui, dans le cadre du projet Discover, un ensemble de données de mots-clés liés à la CSAM avec 963 heuristiques dans différentes langues, y compris le portugais, généré à partir d'un corpus d'environ 100 000 textes liés à la CSAM/CSAE collectés lors du traitement des rapports de la hotline brésilienne au cours des dernières années.

Nous publierons le mois prochain le code source et la documentation du classificateur de texte et de l'algorithme d'entraînement également. Cet outil a la capacité de prétraiter les documents pour la sanitisation des textes et de prendre en compte les mots-clés pendant l'entraînement, favorisant la détection du contenu CSAM basé sur des textes dans des langues sous-représentées, telles que le portugais brésilien.

SaferNet publiera également une API sécurisée, offrant un accès contrôlé à des chercheurs et développeurs sélectionnés au 2e trimestre de 2024 dans le cadre du projet Discover.

Au Brésil, nos principaux partenaires sont : le ministère de la Justice et de la Sécurité publique, la Direction de la cybercriminalité de la police fédérale brésilienne, le Service des procureurs fédéraux brésiliens chargé de la lutte contre la cybercriminalité, le Centre d'information sur le réseau brésilien (NIC.br), l'Association des fournisseurs de services Internet brésiliens, les départements d'informatique de plusieurs universités, l'UNICEF et les principales plateformes opérant au Brésil : Google, Youtube, Meta, TikTok et X.

Le projet DISCOVER favorise les synergies entre les partenaires en créant un cycle collaboratif et vertueux qui tire parti des données partagées et des connaissances pour améliorer la compréhension collective, stimuler l'innovation et amplifier l'impact des efforts de chaque entité pour lutter contre la CSAM au Brésil et bénéficiera certainement également à d'autres pays lusophones.

Je suis ravi de cette opportunité de vous rencontrer tous en personne et j'ai hâte de rattraper beaucoup de personnes dans cette salle pour discuter de la façon dont nous pouvons collaborer pour favoriser ce travail au Brésil dans les mois à venir.

Merci beaucoup! Thank you! Obrigado!

*CSAM = child sexual abuse materials - materiais de abuso sexual infantil

SaferNet Brasil | CNPJ: 07.837.984/0001-09