가짜 양성 파라독스
여러분,
패티가 어찌 지내는지 한 번 볼까요....
패티는 베이즈 정리에 관한 강의를 열심히 준비하고 있습니다. 그녀는 이 정리가 확률 및 통계학에서 가장 심오한 내용이라고 생각했습니다. 그녀의 친구가 결혼 전에 결핵 검사를 위해 타인 테스트를 받은 후 양성 판정을 받았던 게 생각났습니다. 이 검사는 결핵(TB)을 식별하는 데 99.9% 정확도를 자랑했습니다. 그 친구는 자신에게 결핵이 있다는 걸 발견하고 엄청난 충격을 받았습니다. 추가 조사를 통해 99.9% 수치는 “병에 걸렸을 경우, 이 검사는 그 때의 해당 질병을 99.9% 식별합니다”라는 말이 더 정확하다는 것이 밝혀졌습니다. 명시하지 않은 중요한 수치가 있는데, 이는 가짜 양성이라고 합니다. 그 백분율은 5%입니다. TB에 걸린 소수의 사람들에 대해, 5% 가짜 양성율은 TB 관련 양성 반응을 보인 거의 모든 사람들은 가짜 양성이며 따라서 TB에 걸리지 않았다는 것을 나타냅니다. 그러므로 그 친구를 비롯한 많은 사람들에게 안도감을 줍니다. 이 상황은 가짜 양성 파라독스의 한 예입니다.
이런 생각에 깊이 빠져 있었던 패티는 전화 소리에 깜짝 놀랐습니다. 전화번호의 지역번호를 보고 그녀가 전에 일하던 회사인 ACME에서 걸려온 전화였습니다. 수화기를 들고
“콜맨 교수”입니다라고 말했습니다. 패티는 이렇게 말하는 게 좋았습니다.
"패티, 안녕하세요! 레기 피어폰트예요!”라고 경쾌한 목소리 들렸습니다.
패티의 가슴이 철렁 내려앉았습니다. 레기는 괜찮은 사람이기는 한데 항상 자신이 이해하지 못하는 문제에 관여하여 경영진으로 하여금 고비용, 저효율 전략을 취하도록 할 때가 많았습니다. 그는 그 정도로 설득력이 뛰어났습니다.
"레기, 무슨 일이예요?" 패티는 건성으로 말했습니다.
“회사에서 새 검사기를 주문하기 전에 당신에게 먼저 전화해서 확인해 보라고 매디건이 고집을 부리네요. 시간 낭비라고 생각하지만 지시는 지시이니까요”라고 피어폰트가 말했습니다.
"자세히 말해 주실래요?" 패티가 물었습니다.
“우리는 일주일 동안 100,000대의 Druid 휴대폰을 생산해야 하는 계약을 체결했어요. 1차 통과 산출량이 99%를 초과할 것으로 확신하고 있어요.” 그는 설명을 시작했습니다.
“대단하군요”라고 패티는 진심으로 대답했습니다.
“99.9% 정확도로 신속한 기능 검사를 통해 결함이 있는 휴대폰을 식별하는 검사기를 몇 대 주문하고 싶어요. 검사기가 고가여서 매디건이 구매 전 건전성 확인을 하기 원해요. 다른 중요한 정보로는, 우리가 출고하는 휴대폰 중 결함있는 휴대폰에 대해서는 막대한 벌금을 물어야 해요.” 레기는 계속 설명했습니다.
“벌금 액수와 함께 99.9%가 올바른 수치이군요. 검사기가 식별하는 결함있는 제품은 어떻게 할 겁니까?” 패티가 물었습니다.
“산출량이 높아서 좋아요. 휴대폰이 복잡하여 결함을 발견하고 수리하는 공정이 매우 더디거든요. 결함을 한 가지 발견하는 데 $5 - $10의 인건비가 들 수 있지만 휴대폰의 가격을 고려해보면 그럴만한 가치가 있어요. 이미 언급했듯이, 산출량이 높아서 이 공정이 필요한 제품이 아주 많지는 않아요.” 피어폰트는 계속 말했습니다.
“검사기에 의한 가짜 양성 판정은 어떻게 할 건가요?” 패티가 물었습니다.
“문제될 게 없어요. 검사기의 정확도가 99.9%라는 것을 잊지 마세요.” 피어폰트가 대답했습니다.
패티는 피어폰트가 그녀의 논점을 이해하지 못하고 있다는 것을 알았지만 그를 실망시키고 싶지는 않았어요……무리하게.
“레기, 당신이 말한 대로, 제품 한 개에 결함이 있으면 검사기는 그 순간 이것을 99.9% 식별해 냅니다. 제가 묻고자 하는 것은 결함이 없는 제품에 대해 검사기가 결함이 있다고 식별하는 빈도는 어떻게 되나요? 이 상황은 대개 '가짜 양성'이라고 불러요.” 패티가 응답했습니다.
“그건 100 – 99.9 또는 0.1%일 겁니다.” 피어폰트가 대답했습니다.
“그건 우량인 불량 제품의 백분율이예요. 이러한 제품을 '이스케이프'라고 종종 부르지요. 가짜 양성율을 결정하는 유일한 방법은 검사를 하는 겁니다. 99.9% 수치로 결정할 수는 없어요.” 패티가 계속 설명했습니다.
상대방 전화에 침묵이 흘렀습니다.
“가짜 양성 수치를 구하기 위해서는 어떻게 해야 합니까?” 레기가 물었습니다.
“약1000개의 우량 제품을 검사한 후 그 중 몇 개를 검사기가 불량한 것으로 식별하는지 파악해야 해요.” 패티가 말했습니다.
“검사기 회사에서 대여해 주는 검사기로 검사해 본 후 다시 전화할께요.” 피어폰트가 대답했습니다.
패티는 전화를 끊었습니다. 피어폰트의 문제는 베이즈 정리와 그녀 친구의 타인 테스트 관련 가짜 양성과 밀접하게 관련되었던 게 재밌다고 패티는 생각했습니다.
이틀 후, 패티, 롭, 피트는 교수님과 점심 식사를 마치고 방금 돌아왔습니다. 세 사람 모두 자신들의 기술적인 문제를 논하기 위해 교수님을 자주 만나 뵈었습니다. 그래서 그들은 교수님께 식사를 대접했지요.
패티가 연구실에 들어오자 피트가 말을 걸었습니다.
“레기 피어폰트가 다시 전화했었나요?” 피트가 물었습니다.
“아니요. 내가 아마 수화기를 내려 놓았었나 봐요. 패티가 웃으며 말했습니다.
그 순간 전화기가 울렸습니다. 피어폰트였어요.
"안녕하세요, 레기! "어떻게 됐어요" 패티는 흥분을 감추지 못하고 물었습니다.
“검사기는 우량품 중 5%가 불량이라고 식별했어요. 당신이 이게 문제라고 말할 거라고 생각하고 있어요.” 피어폰트가 말했습니다.
“검사기로 그것들을 다시 검사해 보면 어떻게 될까요?” 패티가 물었습니다.
“그 IS는 2번 이상 했어요! 한 번만 했을 때는 7%였어요.” 레기가 한숨을 쉬며 말했습니다.
“수치를 볼까요. 100,000개의 제품을 생산하면 5%의 가짜 양성율은 5,000개의 제품이예요. 산출량 손실은 1% 또는 1,000개의 제품이군요. 따라서 실제로는 단지 1,000개의 제품만이 불량품일 경우, 검사기는 약6,000개의 제품이 불량품이라고 식별하게 되는군요. 이 정도 수치면 차이가 크네요. 베이즈 정리를 통해 정확한 수치를 파악할 수 있지만 그건 매우 근사한 값이예요. 검사기가 제품당 $5의 비용을 산정한 후 당신의 분석 과정이 틀리기 때문에 가짜 양성 판단 때문에 매주 2만5천 달러의 손실을 입게 됩니다.
“새로운 전략이 필요하군요." 피어폰트가 낙심하여 말했습니다.
패티와 피트는 피어폰트와 함께 검사기 공급업체가 더 나은 전략을 개발할 수 있도록 돕기로 했습니다.
후기:
패티와 피트는 피어폰트가 검사기 공급업체와 더불어 효과적인 검사 전략을 개발할 수 있도록 도와 주었습니다. 패티도 피트도 레기를 잘 몰랐었는데, 이 공동 작업 후 굉장히 가까워졌습니다. 레기는 이 과정에 매우 집중하여 많은 것을 배운 것 같았습니다. 패티는 이 데이터의 일부를 강의에서 이용할 수 있었습니다.
패티는 몇주 후 우편으로 아름다운 카드를 받았습니다. 열어 보니, "패티에게, 도와주셔서 감사했습니다. 당신과 피트의 도움이 없었더라면 우리의 검사 전략은 성공하지 못했을 거예요. 감사합니다. 당신의 신실한 학생, 마이크 매디건."
패티는 목이 메어 오는 걸 느꼈습니다.
감사합니다.
론 박사
다음 웹사이트에서 그림을 참고하세요. http://www.hgpauction.com/wp-content/uploads/2012/04/Electronic-Test-1-1024x716.jpg
Translation powered by Avalon Professional Translation
Connect with Indium.
Read our latest posts!