{"id":2838,"date":"2025-05-20T22:06:28","date_gmt":"2025-05-20T22:06:28","guid":{"rendered":"https:\/\/blog.mageia.org\/pt\/?p=2838"},"modified":"2025-05-20T22:06:28","modified_gmt":"2025-05-20T22:06:28","slug":"uma-avalanche-de-bots-de-ia-esta-repetidamente-derrubando-partes-do-nosso-site","status":"publish","type":"post","link":"https:\/\/blog.mageia.org\/pt\/2025\/05\/20\/uma-avalanche-de-bots-de-ia-esta-repetidamente-derrubando-partes-do-nosso-site\/","title":{"rendered":"Uma avalanche de bots de IA est\u00e1 repetidamente derrubando partes do nosso site"},"content":{"rendered":"\n<p>Sempre tivemos bots visitando nosso site. Eram, em sua maioria, bots gentis, como os rastreadores que mant\u00eam os bancos de dados dos mecanismos de busca atualizados. Esses bots gentis come\u00e7am analisando nossos arquivos robots.txt antes de fazer qualquer coisa e respeitam as restri\u00e7\u00f5es definidas nesses arquivos.<\/p>\n\n\n\n<p><span class=\"HwtZe\" lang=\"pt\"><span class=\"jCAhz ChMk0b\"><span class=\"ryNqvb\">No entanto, as coisas mudaram.<\/span><\/span> <span class=\"jCAhz ChMk0b\"><span class=\"ryNqvb\">Assim como outros sites, como a <a href=\"https:\/\/www.pcmag.com\/news\/wikipedia-faces-flood-of-ai-bots-that-are-eating-bandwidth-raising-costs\" data-type=\"link\" data-id=\"https:\/\/www.pcmag.com\/news\/wikipedia-faces-flood-of-ai-bots-that-are-eating-bandwidth-raising-costs\" target=\"_blank\" rel=\"noreferrer noopener\">Wikip\u00e9dia<\/a>, estamos sendo cada vez mais visitados por scrapers de IA, rob\u00f4s que vasculham a internet em busca de qualquer coisa que encontrem para treinar aplicativos de IA.<\/span><\/span> <span class=\"jCAhz ChMk0b\"><span class=\"ryNqvb\">Eles geralmente s\u00e3o extremamente famintos por informa\u00e7\u00f5es, ent\u00e3o baixam muito, muito mais do que um usu\u00e1rio comum faria.<\/span><\/span> <span class=\"jCAhz ChMk0b\"><span class=\"ryNqvb\">Al\u00e9m disso, muitos deles s\u00e3o indelicados: n\u00e3o respeitam as regras definidas em nossos arquivos robots.txt, escondem quem realmente s\u00e3o, n\u00e3o fazem uma pequena pausa entre as solicita\u00e7\u00f5es \u2013 pelo contr\u00e1rio, bombardeiam nossos servidores com solicita\u00e7\u00f5es de muitos e muitos endere\u00e7os IP diferentes ao mesmo tempo.<\/span><\/span> <span class=\"jCAhz ChMk0b\"><span class=\"ryNqvb\">O resultado \u00e9 que partes do mageia.org, como nosso <a href=\"https:\/\/bugs.mageia.org\/\" target=\"_blank\" rel=\"noreferrer noopener\">Bugzilla<\/a>, <a href=\"https:\/\/wiki.mageia.org\/\" data-type=\"link\" data-id=\"https:\/\/wiki.mageia.org\/\" target=\"_blank\" rel=\"noreferrer noopener\">Wiki<\/a> e <a href=\"https:\/\/forums.mageia.org\/\" target=\"_blank\" rel=\"noreferrer noopener\">F\u00f3runs<\/a>, tornam-se inacess\u00edveis.<\/span><\/span><\/span><\/p>\n\n\n\n<p>Abaixo voc\u00ea pode ver a carga da CPU de um dos nossos servidores mais importantes, onde, entre outras coisas, nossos f\u00f3runs e wiki est\u00e3o localizados:<\/p>\n\n\n\n<p>Abaixo voc\u00ea pode ver a carga da CPU de um dos nossos servidores mais importantes, onde, entre outras coisas, nossos f\u00f3runs e wiki est\u00e3o localizados:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" src=\"https:\/\/blog.mageia.org\/en\/wp-content\/uploads\/2025\/05\/CPU20250518.png\" alt=\"\"\/><\/figure>\n\n\n\n<p><span class=\"HwtZe\" lang=\"pt\"><span class=\"jCAhz ChMk0b\"><span class=\"ryNqvb\">Mesmo que nossa atualiza\u00e7\u00e3o de infraestrutura j\u00e1 tivesse sido conclu\u00edda, isso seria muito dif\u00edcil de mitigar.<\/span><\/span><\/span><\/p>\n\n\n\n<p>Bloquear os endere\u00e7os IP usados \u200b\u200b\u00e9 in\u00fatil, pois eles mudam constantemente para novos. Um dos nossos administradores de sistemas acabou de me contar sobre um grande problema: &#8220;proxys m\u00f3veis&#8221;, em que bots fazem proxy de suas solicita\u00e7\u00f5es por meio dos celulares de usu\u00e1rios desavisados. Isso faz com que as solicita\u00e7\u00f5es pare\u00e7am muito mais leg\u00edtimas e dif\u00edceis de bloquear sem tamb\u00e9m bloquear usu\u00e1rios reais. Grande parte disso acontece sem que os usu\u00e1rios sequer saibam que seus celulares est\u00e3o sendo usados \u200b\u200bdessa forma. Alguns aplicativos incluem proxys junto com algum jogo ou outro aplicativo e os escondem em letras mi\u00fadas nos termos de servi\u00e7o. No ano passado, foi relatado que a <a href=\"https:\/\/thehackernews.com\/2024\/04\/malicious-apps-caught-secretly-turning.html\" data-type=\"link\" data-id=\"https:\/\/thehackernews.com\/2024\/04\/malicious-apps-caught-secretly-turning.html\" target=\"_blank\" rel=\"noreferrer noopener\">Google havia removido v\u00e1rios desses aplicativos de sua loja<\/a>.<\/p>\n\n\n\n<p>Al\u00e9m de celulares, existem dispositivos de IoT e tamb\u00e9m computadores comuns que acabaram em botnets por n\u00e3o estarem bem protegidos. Eles podem ser usados \u200b\u200bpara raspagem de IA e provavelmente j\u00e1 o s\u00e3o.<\/p>\n\n\n\n<p>Nossos administradores de sistemas conseguem, repetidamente, mitigar o problema, mas \u00e9 um &#8220;jogo de gato e rato&#8221;, ent\u00e3o \u00e9 prov\u00e1vel que o problema ocorra novamente.<\/p>\n\n\n\n<p>Se voc\u00ea conhece pessoas que trabalham com aplica\u00e7\u00f5es de IA e precisam ser treinadas, pe\u00e7a a elas que garantam que seus rob\u00f4s leiam e respeitem os arquivos robots.txt que encontrarem. E, claro, incentive seus amigos e familiares, quando achar que eles precisam, a garantir que seus computadores e outros dispositivos inteligentes recebam todas as atualiza\u00e7\u00f5es de seguran\u00e7a assim que forem lan\u00e7adas.<\/p>\n\n\n\n<p>(escrito em ingl\u00eas por <a href=\"https:\/\/blog.mageia.org\/en\/2025\/05\/18\/an-avalanche-of-ai-bots-is-repeatedly-taking-parts-of-our-website-down\/\" data-type=\"link\" data-id=\"https:\/\/blog.mageia.org\/en\/2025\/05\/18\/an-avalanche-of-ai-bots-is-repeatedly-taking-parts-of-our-website-down\/\" target=\"_blank\" rel=\"noreferrer noopener\">marja<\/a> e traduzido por xgrind)<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Sempre tivemos bots visitando nosso site. Eram, em sua maioria, bots gentis, como os rastreadores que mant\u00eam os bancos de dados dos mecanismos de busca atualizados. Esses bots gentis come\u00e7am analisando nossos arquivos robots.txt antes de fazer qualquer coisa e &hellip; <a href=\"https:\/\/blog.mageia.org\/pt\/2025\/05\/20\/uma-avalanche-de-bots-de-ia-esta-repetidamente-derrubando-partes-do-nosso-site\/\">Continuar a ler <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":13,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"jetpack_post_was_ever_published":false,"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","enabled":false},"version":2}},"categories":[1],"tags":[11,5,27,29],"class_list":["post-2838","post","type-post","status-publish","format-standard","hentry","category-sem-categoria","tag-comunidade","tag-mageia","tag-servidores","tag-website"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_shortlink":"https:\/\/wp.me\/p1R7Hh-JM","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/blog.mageia.org\/pt\/wp-json\/wp\/v2\/posts\/2838","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.mageia.org\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.mageia.org\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.mageia.org\/pt\/wp-json\/wp\/v2\/users\/13"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.mageia.org\/pt\/wp-json\/wp\/v2\/comments?post=2838"}],"version-history":[{"count":2,"href":"https:\/\/blog.mageia.org\/pt\/wp-json\/wp\/v2\/posts\/2838\/revisions"}],"predecessor-version":[{"id":2840,"href":"https:\/\/blog.mageia.org\/pt\/wp-json\/wp\/v2\/posts\/2838\/revisions\/2840"}],"wp:attachment":[{"href":"https:\/\/blog.mageia.org\/pt\/wp-json\/wp\/v2\/media?parent=2838"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.mageia.org\/pt\/wp-json\/wp\/v2\/categories?post=2838"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.mageia.org\/pt\/wp-json\/wp\/v2\/tags?post=2838"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}