스컨소프 문제
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
스컨소프 문제는 특정 단어가 포함된 텍스트가 필터링되어 예상치 못한 결과를 초래하는 현상을 의미한다. 1996년 AOL의 욕설 필터가 스컨소프 마을 이름에 포함된 단어 때문에 계정 생성을 막은 사건에서 유래되었으며, 이후 웹 검색, 이메일, 소셜 미디어 등 다양한 분야에서 발생했다. 해결책으로는 오탐을 방지하기 위한 화이트리스트를 사용하는 방법이 제시되었으며, 여러 의미를 가진 단어, 지명, 개인 이름 등이 필터링되어 불편을 초래하는 사례가 보고되었다.
더 읽어볼만한 페이지
- 스팸 필터 - DMARC
DMARC는 SPF 및 DKIM으로 보호되는 이메일의 발신 도메인이 인증에 실패할 경우 수신자의 처리 정책을 DNS 레코드에 명시하고, `From:` 필드 도메인 정렬을 확인하여 스팸 및 피싱 메일 방지 및 이메일 보안 상태 모니터링을 지원하는 이메일 인증 프로토콜이다. - 스팸 필터 - TXT 레코드
TXT 레코드는 DNS에서 임의의 텍스트 데이터를 저장하는 데 사용되며, 도메인 소유권 확인, SPF 구현, 전자우편 메시지 발신자 확인, 제로 컨피규레이션 네트워킹, DMARC 정책 등 다양한 목적으로 활용된다. - AOL - 엔가젯
엔가젯은 2004년 피터 로하스가 설립한 기술 관련 웹사이트로, 가젯 정보, 팟캐스트 운영, 여러 언어 블로그 운영, 논란 등을 특징으로 한다. - AOL - ICQ
ICQ는 1996년에 개발되어 텍스트 기반 메신저로 인기를 얻었으며, AOL과 Mail.Ru 그룹을 거쳐 2024년 6월 26일 서비스가 종료되었다. - 욕설 - 니거
'니거'는 라틴어에서 유래한 인종차별적 욕설로, 흑인을 지칭하는 중립적 단어에서 모욕적 의미로 변질되어 현재는 금기시되며, 흑인 사회 내부에서 변형된 형태로 사용되기도 하지만 흑인이 아닌 사람이 사용하는 것은 인종차별 행위로 간주된다. - 욕설 - 도발
| 스컨소프 문제 | |
|---|---|
| 문제 개요 | |
| 명칭 | 스컨소프 문제 |
| 다른 이름 | 필터링 문제 욕설 필터 문제 부적절한 단어 필터 문제 |
| 정의 | 의도치 않은 단어나 문구가 욕설 필터에 의해 검열되는 현상 |
| 예시 | "assessment" (ass 포함) "classic" (ass 포함) "therapist" (rapist 포함) "Scunthorpe" (cunt 포함) |
| 기술적 배경 | |
| 원리 | 특정 문자열(욕설)을 포함하는 단어를 필터링 |
| 문제점 | 무관한 단어까지 필터링되어 의사소통 방해 |
| 발생 원인 | |
| 단순 문자열 매칭 | 필터링 시스템이 문맥을 고려하지 않고 단순히 문자열 포함 여부만 판단 |
| 과도한 필터링 규칙 | 지나치게 광범위하거나 엄격한 필터링 규칙 적용 |
| 해결 방안 | |
| 문맥 분석 | 단어의 의미와 문맥을 파악하여 필터링 |
| 화이트리스트/블랙리스트 | 허용/금지 단어 목록을 활용하여 필터링 정확도 향상 |
| 머신러닝 | 텍스트 분석 기술을 활용하여 필터링 |
| 예외 처리 | 오탐 가능성이 높은 단어에 대한 예외 규칙 설정 |
| 사회적 영향 | |
| 의사소통 제약 | 특정 단어 사용이 제한되어 자유로운 의사소통 어려움 |
| 창의성 억압 | 필터링을 피하기 위한 우회적인 표현 사용으로 창의성 저하 가능성 |
| 사회적 편견 강화 | 특정 단어에 대한 과도한 검열이 사회적 편견을 강화할 수 있음 |
2. 어원 및 기원
이 문제는 1996년 4월 AOL의 욕설 필터가 영국의 스컨소프 마을 이름에 "cunt"라는 문자열이 포함되어 있어 스컨소프 주민들이 AOL 계정을 생성하지 못하게 한 사건에서 유래되었다.[1] 2000년대 초반에는 구글의 선택적 SafeSearch 기능에서도 같은 오류가 발생하여, 스컨소프를 포함한 지역 서비스 및 기업들이 검색 결과에서 누락되었다.[2]
스컨소프 문제는 단어의 맥락을 이해할 수 있는 필터를 만드는 것이 어렵기 때문에 완전히 해결하기 어렵다.[3][4]
욕설 필터의 오판은 다양한 분야에서 발생한다.
3. 해결 방법
한 가지 해결책은 알려진 오탐의 화이트리스트를 만드는 것이다. 화이트리스트에 나타나는 모든 단어는 필터에서 무시할 수 있다. 비록 그렇지 않으면 허용되지 않을 텍스트를 포함하고 있더라도 말이다.[5]
4. 다른 예시
4. 1. 거부된 웹 도메인 이름 및 계정 등록
4. 2. 차단된 웹 검색
4. 3. 차단된 이메일
4. 4. 여러 의미를 가진 단어로 인한 차단
4. 5. 뉴스 기사
4. 6. 비디오 게임
4. 7. 기타
2013년, 스웨덴 도시 팔룬의 이름을 딴 파일 전송으로 인해 중국에 본사를 둔 기업 디아크리트에서 웹 연결이 중단되는 문제가 발생했다. 이는 파일 이름이 중국에서 금지된 종교 운동인 파룬궁에 대한 논의를 차단하는 데 사용되는 만리 방화벽의 검열을 촉발했기 때문이다.[41]
2013년 11월, 페이스북은 영국 사용자가 패것이라는 단어를 사용하여 동명의 전통 음식을 언급하는 것을 일시적으로 차단했다.[42]
2018년 5월, 식료품점 퍼블릭스의 웹사이트에서는 라틴어 문구 ''summa cum laude''가 포함된 케이크 주문을 허용하지 않았다. 고객은 특별 지침을 포함하여 문제를 해결하려 했지만 결국 "Summa --- Laude"라고 적힌 케이크를 받았다.[43][44]
2020년 5월, 영국 정치 고문 도미닉 커밍스를 직접 언급하는 일부 해시태그는 ''cum''이라는 하위 문자열이 반 포르노 필터를 트리거하여 트위터 트렌드에 오르지 못했다.[45]
2020년 10월, 고생물학 컨퍼런스의 가상 회의 플랫폼은 "뼈", "치골", "스트림"을 포함한 다양한 단어를 차단했다.[46]
2021년 1월, 페이스북은 데번의 랜드마크 플리머스 호를 여성 혐오적인 것으로 잘못 표시한 후 사용자 음소거 및 차단에 대해 사과했다.[47]
2021년 4월, 프랑스 코뮌 비슈의 공식 페이스북 페이지가 삭제되었다. 페이스북은 나중에 사과하고 원래 페이지를 복원했다.[48][49]
스마트폰용 앱 게임인 벽람항로에서는 "에식스 (항공모함)"나 "서식스 (중순양함)"를 모티브로 한 캐릭터가 등장했지만, 출시 초기 "섹스"(성행위)가 금지어였기 때문에 게임 내 채팅에서 이름을 언급할 수 없었다. 현재는 수정되었다.
니코니코 생방송에서, 웹 브라우저 "스레이프닐(Sleipnir)"은 "강간"(rape)이 포함되어 있기 때문에 댓글에서 이 이름을 사용할 수 없어, 이름을 언급할 때는 영어 표기인 "Sleipnir" 또는 "푸닐"이라는 약칭이 사용된다.
마인크래프트에서, 차별 용어이기도 한 "jap(잽)"을 입력할 수 없도록 (ja 다음에 p를 입력하면 오류 메시지가 표시됨) 했기 때문에 "japan"도 입력할 수 없게 되는 문제가 발생했다.[81]
참조
[1]
간행물
AOL censors British town's name!
http://catless.ncl.a[...]
1996-04-25
[2]
웹사이트
Google's chastity belt too tight
https://www.cnet.com[...]
CNET
2004-04-23
[3]
웹사이트
Life on the Internet Is Hard When Your Last Name is 'Butts'
https://www.vice.com[...]
2022-07-31
[4]
웹사이트
The Scunthorpe Problem, And Why AI Is Not A Silver Bullet For Moderating Platform Content At Scale
https://www.techdirt[...]
2022-07-31
[5]
서적
Your Wit Is My Command: Building AIs with a Sense of Humor
https://books.google[...]
MIT Press
2021
[6]
웹사이트
Food domain found "obscene"
https://www.cnet.com[...]
News.com
1998-04-27
[7]
웹사이트
Foire aux questions
http://www.radio-can[...]
radio-canada.ca
2011-02-24
[8]
뉴스
How Mr C0ckburn fought spam
https://www.smh.com.[...]
2004-02-26
[9]
웹사이트
BBC fail – my correct name is not permitted
https://blog.silicon[...]
2010-03-09
[10]
웹사이트
Is Yahoo Banning Allah?
http://kallahar.com/[...]
Kallahar's Place
2011-02-24
[11]
뉴스
When your name gets turned against you
http://www.philly.co[...]
2008-08-03
[12]
뉴스
E-Rate And Filtering: A Review Of The Children's Internet Protection Act
http://www.gpo.gov/f[...]
Congressional Hearings. General. Energy and Commerce, Subcommittee on Telecommunications and the Internet
2001-04-04
[13]
뉴스
F-Word Town's Name Gets Censored By Internet Filter
http://www.switched.[...]
2011-07-27
[14]
뉴스
Following Jiang Death Rumors, China's Rivers Go Missing
https://blogs.wsj.co[...]
2011-07-06
[15]
뉴스
Wine lovers cannot buy Burgundy tipple on Google as internet giant cracks down on 'gun' searches
https://www.telegrap[...]
2018-02-27
[16]
뉴스
Yahoo admits mangling e-mail
http://news.bbc.co.u[...]
BBC News
2013-06-21
[17]
웹사이트
Hard news
http://www.ntk.net/2[...]
2002-07-12
[18]
뉴스
Email security filter spawns new words
https://www.newscien[...]
2013-06-21
[19]
뉴스
E-mail vetting blocks MPs' sex debate
http://news.bbc.co.u[...]
BBC News
2003-02-04
[20]
뉴스
Software blocks MPs' Welsh e-mail
http://news.bbc.co.u[...]
BBC News
2003-02-05
[21]
웹사이트
Name of museum is confused with porn
http://www.newsshopp[...]
2004-10-05
[22]
뉴스
Panto email falls foul of filth filter
https://www.theguard[...]
2004-10-13
[23]
뉴스
E-mail filter blocks 'erection'
http://news.bbc.co.u[...]
2006-05-30
[24]
뉴스
The Beaver mag renamed to end porn mix-up
https://www.smh.com.[...]
2021-02-24
[25]
뉴스
Web Filters Cause Name Change for a Magazine
https://www.nytimes.[...]
2021-02-24
[26]
뉴스
How spam filters dictated Canadian magazine's fate
http://news.bbc.co.u[...]
BBC News
2010-03-29
[27]
뉴스
Luxemburger Twitter-Neubenutzer nach 29 Minuten blockiert.
http://www.tageblatt[...]
2010-06-12
[28]
뉴스
Black Country Councillor Caught up in Faggots Farce
https://www.birmingh[...]
2011-02-24
[29]
뉴스
The 10 best words the internet has given English
https://www.theguard[...]
2013-04-17
[30]
서적
Unmentionables: From Family Jewels to Friendly Fire – What We Say Instead of What We Mean
https://books.google[...]
John Murray
[31]
웹사이트
Don't Let Spam Filters Snatch Your Resume
http://www.collegejo[...]
2008-02-11
[32]
웹사이트
Homophobic news site changes athlete Tyson Gay to Tyson Homosexual
http://boingboing.ne[...]
2008-06-30
[33]
뉴스
Computer autocorrects surname 'gay' to.. no, you guess
https://www.theguard[...]
2008-06-30
[34]
웹사이트
The Dangers of Auto-Replace
https://www.rightwin[...]
People for the American Way
2021-02-24
[35]
뉴스
The Clbuttic Mistake: When obscenity filters go wrong
https://www.telegrap[...]
2008-09-02
[36]
웹사이트
The Clbuttic Mistake: A Thing Of The Past?
https://moderationap[...]
2024-11-25
[37]
웹사이트
Clbuttic
https://www.collinsd[...]
2024-11-25
[38]
뉴스
Microsoft Confirms "Gaywood" Is An Offensive Surname, Mr. Gaywood Responds
http://consumerist.c[...]
2008-05
[39]
뉴스
These Are The Words Nintendo Censors From Appearing On The 3DS
https://www.techtime[...]
2023-11-14
[40]
뉴스
UK porn filter blocks game update that contained 'sex'
https://www.theguard[...]
2014-01-21
[41]
뉴스
China's 'Wall' Hits Business
http://online.wsj.co[...]
2013-05-25
[42]
뉴스
Faggots and peas fall foul of Facebook censors
https://www.expressa[...]
2013-11
[43]
뉴스
Proud mom orders 'Summa Cum Laude' cake online. Publix censors it: Summa … Laude.
https://www.washingt[...]
2018-05-22
[44]
뉴스
Publix Censors Teen's 'Summa Cum Laude' Graduation Cake
https://www.huffpost[...]
2018-05-22
[45]
뉴스
Anti-porn filters stop Dominic Cummings trending on Twitter
https://www.theguard[...]
2020-05-27
[46]
뉴스
A Profanity Filter Banned the Word 'bone' at a Paleontology Conference
https://www.vice.com[...]
2020-10-15
[47]
뉴스
Facebook apologises for flagging Plymouth Hoe as offensive term
https://www.theguard[...]
2021-01-27
[48]
웹사이트
Insolite : Bitche est censuré par Facebook
https://www.radiomel[...]
2021-04-12
[49]
웹사이트
Facebook takes down official page for French town of Bitche
https://www.politico[...]
2021-07-03
[50]
웹사이트
AOL censors British town's name!
http://catless.ncl.a[...]
ACM Committee on Computers and Public Policy
2017-07-29
[51]
웹사이트
Google's chastity belt too tight
http://news.cnet.com[...]
2017-07-29
[52]
웹사이트
Food domain found "obscene"
http://www.news.com/[...]
CNET
2017-07-29
[53]
웹사이트
Foire aux questions
http://www.radio-can[...]
radio-canada.ca
2011-02-24
[54]
웹사이트
How Mr C0ckburn fought spam
http://www.smh.com.a[...]
2004-02-26
[55]
웹사이트
BBC fail – my correct name is not permitted
http://blog.silicong[...]
blog.siliconglen.com
2010-03-09
[56]
웹사이트
Is Yahoo Banning Allah?
http://kallahar.com/[...]
Kallahar's Place
2011-02-24
[57]
웹사이트
When your name gets turned against you
http://www.philly.co[...]
2008-08-03
[58]
문서
E-Rate And Filtering: A Review Of The Children's Internet Protection Act
http://www.gpo.gov/f[...]
[59]
뉴스
F-Word Town's Name Gets Censored By Internet Filter
http://www.switched.[...]
2011-07-27
[60]
뉴스
Following Jiang Death Rumors, China’s Rivers Go Missing
http://blogs.wsj.com[...]
2011-07-07
[61]
뉴스
Yahoo admits mangling e-mail
http://news.bbc.co.u[...]
BBC News
2013-06-21
[62]
웹사이트
Hard news
http://www.ntk.net/2[...]
2002-07-12
[63]
뉴스
Email security filter spawns new words
http://www.newscient[...]
New Scientist
2013-06-21
[64]
웹사이트
Name of museum is confused with porn
http://www.newsshopp[...]
News Shopper
2004-10-05
[65]
웹사이트
Comment headaches
http://www.pekingduc[...]
The Peking Duck
2004-11-21
[66]
뉴스
E-mail filter blocks 'erection'
http://news.bbc.co.u[...]
BBC
2006-05-30
[67]
뉴스
Panto email falls foul of filth filter
http://www.guardian.[...]
2004-10-14
[68]
뉴스
E-mail vetting blocks MPs' sex debate
http://news.bbc.co.u[...]
BBC
2003-02-04
[69]
뉴스
Software blocks MPs' Welsh e-mail
http://news.bbc.co.u[...]
BBC
2003-02-05
[70]
웹사이트
Don't Let Spam Filters Snatch Your Resume
http://www.collegejo[...]
2008-02-11
[71]
뉴스
Canada's The Beaver magazine renamed to end porn mix-up
http://www.google.co[...]
2010-01-12
[72]
뉴스
How spam filters dictated Canadian magazine's fate
http://news.bbc.co.u[...]
BBC News
2010-03-29
[73]
뉴스
Black Country Councillor Caught up in Faggots Farce
http://www.birmingha[...]
2011-02-24
[74]
뉴스
The word 'cock' is banned on RSPB's website
http://www.dailymail[...]
2012-11-13
[75]
웹사이트
The 10 best words the internet has given English: From hashtags to LOLs to Cupertinos and Scunthorpe problems, Tom Chatfield picks the most interesting neologisms drawn from the digital world guardian.co.uk
http://www.guardian.[...]
2017-07-29
[76]
서적
Unmentionables: From Family Jewels to Friendly Fire – What We Say Instead of What We Mean
https://books.google[...]
John Murray
2013-06-21
[77]
웹사이트
Homophobic news site changes athlete Tyson Gay to Tyson Homosexual
http://boingboing.ne[...]
BoingBoing
2008-06-30
[78]
뉴스
The Clbuttic Mistake: When obscenity filters go wrong
http://www.telegraph[...]
2010-04-04
[79]
뉴스
What the D***ens is going on? Over-zealous censors filter out favourite TV names (and don't even think of watching an Arsenal game
http://www.dailymail[...]
2011-12-20
[80]
웹사이트
UK porn filter blocks game update that contained 'sex'
http://www.theguardi[...]
2014-01-21
[81]
Youtube
今マインクラフトでジャパンって入力できないらしい
https://www.youtube.[...]
2022-11-26
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com