AI 요약
META는 웹사이트 및 앱에서 데이터를 자동 수집하는 스크래핑 문제에 대해 투명성을 강화하고 있습니다.
100명 이상의 전담팀과 일일 수십억 건의 스크래핑 시도 차단으로 데이터 오용 리스크를 완화하며, 300건 이상의 법적 조치를 통해 플랫폼 남용에 대응하고 있습니다.
이는 META의 사용자 데이터 보호 노력 강화로 긍정적인 신호입니다.
핵심 포인트
- META는 웹사이트 및 앱에서 데이터를 자동 수집하는 스크래핑 문제에 대해 투명성을 강화하고 있습니다.
- 100명 이상의 전담팀과 일일 수십억 건의 스크래핑 시도 차단으로 데이터 오용 리스크를 완화하며, 300건 이상의 법적 조치를 통해 플랫폼 남용에 대응하고 있습니다.
- 이는 META의 사용자 데이터 보호 노력 강화로 긍정적인 신호입니다.
긍정 / 부정 요인
긍정 요인
- 스크래핑 문제에 대한 투명성 강화
- 100명 이상의 전담팀 운영
- 일일 수십억 건의 스크래핑 시도 차단
- 300건 이상의 법적 조치 시행
- 사용자 데이터 보호 노력 강화
기사 전문
META, '스크래핑'과의 전쟁 선포: 데이터 보호 강화 및 투명성 확대
메타(META)가 최근 플랫폼 내에서 발생하고 있는 '스크래핑(Scraping)' 문제에 대한 대응 강화와 함께 투명성 확대를 위한 노력을 공개했습니다. 스크래핑은 웹사이트나 앱에서 데이터를 자동 수집하는 행위로, 검색 엔진의 웹 크롤링과 같이 합법적인 경우도 있지만, 서비스 약관을 위반하는 무단 스크래핑은 심각한 데이터 오용으로 이어질 수 있습니다.
메타는 이번 발표를 통해 무단 스크래핑에 맞서기 위한 구체적인 노력과 함께, 최근 논란의 중심에 있었던 '전화번호 열거(phone number enumeration)'라는 스크래핑 기법에 대한 상세한 내용을 공유했습니다. 이는 플랫폼 내 다양한 형태의 악용 사례에 대한 투명성을 높이기 위한 노력의 일환입니다.
이와 더불어 메타는 플랫폼 무결성 노력을 한곳에서 확인할 수 있는 새로운 '투명성 센터(Transparency Center)'를 출시했으며, 2020년 하반기 투명성 보고서와 올해 1분기 커뮤니티 표준 집행 보고서도 함께 공개했습니다.
데이터 오용 방지를 위한 메타의 노력
스크래핑은 소셜 미디어 플랫폼뿐만 아니라 홈 피트니스 장비 업체, 건강 앱, 은행, 전자상거래, 숙박업 등 다양한 산업 분야에 영향을 미칩니다. 공개적으로 접근 가능한 데이터가 있는 모든 웹사이트나 앱은 스크래핑의 잠재적 표적이 될 수 있습니다.
메타는 이러한 위험을 인지하고 있으며, 스크래핑 위험을 완전히 제거할 수는 없지만 플랫폼 내 스크래핑 위험을 완화하기 위한 여러 조치를 시행하고 있습니다.
외부 데이터 오용 전담팀 운영: 100명 이상의 인력으로 구성된 전담팀이 스크래핑과 관련된 행동 패턴을 탐지, 조사 및 차단하는 데 집중하고 있습니다.
속도 및 데이터 제한 적용: 단일 사용자가 특정 기능을 통해 얻을 수 있는 데이터 양을 제한하고, 무단 자동화에 대한 장애물을 설치합니다.
대규모 스크래핑 시도 차단: 페이스북과 인스타그램 전반에 걸쳐 매일 수십억 건의 의심스러운 스크래핑 시도를 차단하고 있습니다.
연구 협력 및 데이터셋 확보: 페이스북 사용자 데이터가 포함된 공개 접근 가능 데이터셋을 발견하고 확보하기 위해 연구자들과 협력합니다. 이러한 데이터셋은 다양한 호스팅 제공업체 및 온라인 플랫폼에서 발견되며, 악의적인 행위자들이 데이터를 재활용하거나 조작하는 경우가 많아 중복되거나 부정확한 정보를 포함하기도 합니다.
강력한 법적 조치 시행: 메타는 페이스북 데이터가 포함된 스크래핑 데이터셋을 발견할 경우, 이를 삭제하거나 책임자를 추적하기 위한 다양한 조치를 취합니다. 지난 한 해 동안 300건 이상의 플랫폼 오용 사례에 대해 경고 및 중지 서한 발송, 계정 비활성화, 소송 제기, 호스팅 제공업체 지원 요청 등 집행 조치를 취했습니다. 최근에는 서비스 약관을 위반한 'Massroot8' 운영자와 합의를 통해 서비스를 중단시키고 운영자 및 관련 인물의 페이스북, 인스타그램 영구 이용 금지 조치를 성공적으로 시행했습니다.
'전화번호 열거' 기법에 대한 상세 분석
메타가 특히 강력하게 대응하고 있는 스크래핑 기법 중 하나는 '전화번호 열거(phone number enumeration)'입니다. 이는 전화번호를 기반으로 개인에 대한 정보를 대규모로 수집하기 위해 자동화된 도구를 사용하는 방식입니다.
2019년 9월 이전, 스크래핑 공격자들은 메타의 연락처 검색 기능을 악용하여 페이스북에서 친구를 찾고 연결하는 것을 방해했습니다. 이 기능에는 사용자가 모바일 기기의 연락처를 페이스북에 업로드하여 전화번호를 기반으로 일치하는 사람을 찾는 연락처 가져오기 기능이 포함되었습니다. 메타는 스크래핑 공격자들이 이 기능을 악용하여 전화번호 열거를 통해 정보를 수집했다고 보고 있습니다.
전화번호 열거는 일반적으로 다음과 같은 방식으로 작동합니다.
스크래핑 공격자들은 페이스북 또는 기타 인기 플랫폼 계정과 연결될 가능성이 높은 다수의 휴대폰 번호가 존재하는 지역을 표적으로 삼습니다.
특정 전화번호 형식을 선택하고 대상 전화번호 목록을 자동으로 생성합니다.
이 번호들을 사용하여 수많은 시뮬레이션된 모바일 장치에서 연락처 목록을 생성합니다.
스크래핑 공격자들은 속도 또는 데이터 제한을 우회하고 일반 사용자 활동처럼 보이게 하기 위해 여러 시뮬레이션된 장치에 걸쳐 활동을 분산시킵니다.
각 시뮬레이션된 장치는 스크래핑 공격자의 번호 목록 중 일부를 포함하는 연락처 목록을 대상 웹사이트 또는 앱의 연락처 가져오기 기능에 업로드합니다.
연락처 가져오기 기능은 사용자의 개인 정보 설정에 따라 일치하는 연락처에 대한 정보를 반환합니다.
스크래핑 공격자들은 이 정보를 별도의 데이터베이스에 집계합니다.
메타는 이러한 기법에 대응하기 위해 연락처 가져오기 기능에 대한 개선을 진행했으며, 스크래핑 공격자들의 방법이 계속 변화함에 따라 방어 체계를 정기적으로 검토하고 업데이트하고 있습니다. 메타는 속도 제한, 데이터 제한, 행동 탐지 및 기타 보호 조치를 포함한 다양한 방법을 통해 스크래핑을 어렵게 만드는 것을 최우선 방어선으로 삼고 있습니다. 사용자들이 안심하고 서비스를 이용할 수 있도록 정보 보호에 힘쓰는 동시에, 스크래퍼의 기능 접근을 제한하면서도 사용자들이 서로 연결하고 공유하는 데 불편함이 없도록 균형을 맞추고 있습니다.