제목 : 수학의 쓸모
작가 : 닉 폴슨
번역 : 노태복
출판사 : 더퀘스트
읽은날 : 2020/08/14 - 2020/09/11
제목에 속았다..
정확하게는 AI가 세상을 어떻게 바꿀 수 있는가가 맞을듯하다.
흥미를 끌기 위해서인지 처음 출발은 넷플릭스에서 시작한다.
넷플릭스에서 어떻게 고객에게 영화를 추천하는지에 대해 설명하면서 AI의 근간이 되는 베이즈 정리에 대해서 설명한다.
학교다니면서 베이즈정리나 베이즈 통계를 배우긴 했지만 이 분야가 이렇게까지 쓰이리라고는 전혀 생각하지 못했다.
베이즈 통계 배우면서 빨간펜과 자를 가지고 패턴찾으면서 '이런 것도 통계인가?' 했었는데...
저자가 AI기술에 대해서 참 낙관적이다.
중간중간 AI 의사결정의 문제점을 이야기하긴 하지만 극복할 수 있다고 주장한다.
인류의 성품이 본래부터 악하다고 믿는 나하고는 견해차가 크다.
내가 어떻게 생각하건간에 AI는 더 많은 분야에서 쓰이게 될 것이다.
드디어 하나님 대신 AI를 미는 세상이 오고있다.
P20 시리즈 제작자에 따르면, 넷플릭스는 다음과 같은 말을 거침없이 할 수 있는 유일한 회사였다. "잘될 것 같네요. 우리 소프트웨어를 돌려보니 많은 시청자가 이 시리즈를 볼 거라는 결과가 나왔습니다. 시험 방송은 만들어 오시지 않아도 됩니다. 몇편으로 만들고 싶으신가요?
P22 미래의 핵심 알고리즘은 검색이 아니라 추천이다
P27 왈드가 어렵던 시절에 은혜를 베풀었던 슐레징어가 바로 그날 스스로 목숨을 끊었다
P31 기라성 같은 인물들이 모인 조직에서 왈드는 르브론 제임스와 비슷했다. 모든 일을 도맡아 하는 이 농구 선수처럼 가장 어려운 문제들은 죄다 왈드의 책상 위에 놓였다
P35 해군은 총알구멍 개수나 세려고 수학자들을 무더기로 데려다 놓았던 게 아니다. 적절한 데이터가 부족한 상황에서 특정 부위를 공격당한 비행기가 살아 돌아올 조건부확률을 구하려는 것이었다
P49 이용자가 매긴 수천만 건의 평가 등급을 바탕으로 AI 시스템이 상관관계 패턴을 읽어내서 잠재 특성을 찾아내는 것이다
P56 2016년 미국 대선 시기에 많은 사람한테 경고등이 울렸다. 러시아가 페이스북의 맞춤형 광고 시스템을 교묘히 악용해 미국 유권자들의 분열을 조장한 것이다
P59 우리는 사람들이 기계를 전부 파괴하지 않고서도 최악의 기술 남용을 방지할 만큼 현명해질 수 있다고 낙관한다
P68 어떤 지식 분야든 간에 똑똑하다는 것은 많은 패턴을 안다는 의미다. 어떤 입력을 적절한 출력과 일치시켜야 하는지 아는 것이다
P86 안드로메다성운은 지구로부터 1000만 광년 이상 떨어져 있었다. 우리은하로부터 한참 바깥에 위치했던 것이다. 게다가 그렇게 멀리 있는데도 지구에서 육안으로 볼 수 있으니 엄청나게 거대하다고 할 수 있었다
P98 과적합은 어떤 모형이 학습데이터 안의 무작위적인 노이즈 신호만 기억하고 기본 패턴을 학습하지 못할 때 생긴다. 과적합 모형은 과거를 매우 정확하게 기술할 지 모르나 미래를 예측하는 데는 서툴다
P102 대다수의 AI 어플리케이션에서 가장 어려운 부분은 모형을 학습시키는 일이 아니라 '모형에 제공하는 입력을 숫자의 집합으로 어떻게 표현할 것인가?' 하는 문제다
P105 2016년이 되자 후속 모형들은 3퍼센트 미만의 오류 비율을 달성해 평균적인 인간의 능력을 뛰어넘었다
P106 남성 천문학자들은 모두 맥동변광성을 이용해 우주의 크기를 재는 방법을 알려준 레빗의 기념비적인 공식을 잘 알고 있었다. 하지만 아무도 레빗이 응당 받아야 할 영예를 표하지 않았다. 그 사람들 중 상당수가 보기에 레빗은 단지 계산기에 불과했다
P119 AI에서는 이 현상을 가리켜 모라백 역설이라고 한다. 다섯 살배기한테 쉬운 것이 기계한테는 어렵고, 반대로 기계한테 쉬운 것이 인간에게는 어려운 상황이 바로 모라벡 역설이다.(로봇공학의 선구자인 한스 모라벡의 이름을 딴 명칭이다)
P126 베이즈 규칙의 핵심이다. 사전믿음 + 사실(데이터) = 수정된 믿음
P132 바로 모든 확률이 조건부확률이라는 것이다. 달리 말해서 모든 확률은 우리가 알고 있는 바에 달려 있다. 우리의 지식이 달라지면 확률도 반드시 달라진다는 말이다. 그리고 베이즈 규칙은 확률이 어떻게 달라지는지 알려준다
P143 이것이 베이즈 규칙이다. 암의 사전확률은 1퍼센트다. 데이터를 본 후에, 즉 유방조영술에서 양성판정을 받은 후에도 암의 사후확률은 7.4퍼센트다. 이 사후확률은 사전확률보다는 매우 높지만, 대다수 의사들이 짐작한 70~80퍼센트에는 한참 못 미친다
P166 AI가 지난 10년동안 이룬 가장 중요한 성과는 바로 언어 인식 능력이 인간 수준으로 향상된 것이다
P174 기계언어로 쓰인 프로그램은 원자들이 모여 이루어진 DNA 분자와 비슷하다
P177 호퍼는 자신이 제일 좋아하는 문구를 꺼내들었다. 이후로도 오랜 세월 여러 번 써먹게 될 문구였다. "언어에서 가장 위험한 표현은 '우리는 늘 그런 식으로 해왔어'입니다" 물론 호퍼가 결국에 증명해냈듯이 호퍼의 상관들은 틀렸다
P189 우리는 구글엔그램뷰어라는 온라인 도구를 사용해서 조사해봤다
P207 단어를 벡터로 바꾸기만 하면, 그 벡터로 수학을 할 수 있다는 것이다. 이 변환은 언어를 위한 AI 시스템을 제작하는 데 반드시 필요한 과정이다. 컴퓨터는 단어를 이해하지 못하지만, 수학은 이해한다
P209 2013년 12월에는 구글이 홈페이지 로고로 포허의 탄생 107주년을 기념했다
P237 뉴턴의 마음속에는 다음과 같은 간단한 질문이 떠오르지 않았기 때문이다. '왜 변동성이 큰 동전들이 수백 년 동안이나 견본화폐검사를 통과했는가?' 뉴턴도 대놓고 언급했듯이 개별 동전의 변동성이 법적 기준보다 매우 컸는데도 말이다
P247 도시에 누출이 발생하면 경보가 울리는 '스마트관' 시스템을 설치할 수 있다. 하지만 번거롭고 비용이 매우 많이 든다. 애시는 이와 달리 훨씬 저렴한 해법을 제안했다. 시에서 운영하는 쓰레기 수거 차량이나 시내버스 또는 구급차에 메탄 센서를 장착하는 것이다
P252 1990년대에 머니볼은 스프레드시트와 똑똑한 인턴만 있어도 가능했다. 그러나 이제는 클라우드 기반의 슈퍼컴퓨터와 전문 데이터 과학자로 이루어진 팀이 필요하다
P267 AI는 독인 든 사과가 열리는 나무를 기하급수적으로 자라게 만들 수 있다. 대개는 사람들이 땅을 잘못 관리했다는 이유로 말이다
P274 이 모형은 일정한 확률과 각 사건의 독립성처럼 의도적으로 실제 현실을 버리고 단순성을 택한 가정들에 바탕을 두고 있다
P289 인터넷 시대의 대다수 데이터 집합은 특정한 목적을 위해 매우 비과학적인 조건하에 수집됐으므로 다른 목적에 대해서는 항상 유용하다고 볼 수 없다는 점이다. 이 문제를 극복하거나 우리가 극복할 수 없는 지점이 어딘지 알려면 기존의 가정이 과연 타당한지 더욱 면밀하게 살펴야 한다
P297 새 데이터로 모형에 정기적으로 '양념을 치면', 시간이 흐를수록 더 나은 예측을 내놓는다(이것이 바로 우리가 2장에서 얘기한 시행착오를 통한 모형적합화다)
P301 모형이 실제로 학습한 내용은 나무가 드리운 그림자가 있는 숲과 없는 숲을 구별하는 일이었다. 탱크 찾기에는 쓸모가 없는 기능이었다
P303 AI 알고리즘은 학습한 데이터 집한 안에서 패턴을 찾고 재현하도록 설계되어 있다. 만약 패턴이 본래 차별적이라면 알고리즘 역시 차별하도록 학습될 것이다
P319 나이팅게일은 재능 있는 간호사였다. 하지만 나이팅게일의 재능은 행정가로서 훨씬 더 밝게 빛났다. 처음에는 얌전하게 새로운 청결 지침을 시행하는 정도였지만, 이내 병원의 거의 모든 비의료적 업무를 담당하기 시작했다. 나이팅게일은 자신의 역할이 "요리사, 가정부, 청소부, 세탁부, 일용잡화상, 점원"이라고 했다
P326 나이팅게일의 구상들은 오늘날 국제 질병 분류 체계를 만들 때 뚜렷한 모델이 되었고, 이 체계는 모든 현대 전염병학과 의료 데이터 과학을 위한 초석이 되었다
P348 대형 의료기관들은 만성질환이 만연해야 돈을 번다고 생각한다
'독후감 > 2020_독후감' 카테고리의 다른 글
[2020-57] 킵차크 칸국 (0) | 2020.09.17 |
---|---|
[2020-56] 그림속 천문학 (0) | 2020.09.15 |
[2020-54] 예술하는 습관 (0) | 2020.09.07 |
[2020-53] 순례자의 인문학2 (0) | 2020.09.07 |
[2020-52] 공간이 만든 공간 (0) | 2020.09.03 |