보호되어있는 글입니다.
내용을 보시려면 비밀번호를 입력해주세요.

데이터 시각화 데이터 저널리즘 데이비드 맥캔들레스 David McCandless

데이터 시각화 데이터 저널리즘 데이비드 맥캔들레스 David McCandless 





David McCandless - Does my graph look big in this? from VISUALIZED on Vimeo.


posted by jisunlee

정보디자인 데이터시각화 니콜라스 펠톤 Nicholas Felton 강연

수업시간에 봤던 뉴욕타임즈 인터뷰 동영상


짧은 작업 소개 영상

Nicholas Felton: The Feltron Report from Gestalten on Vimeo.



Eyeo 2017 - Nicholas Felton from Eyeo Festival // INSTINT on Vimeo.




Eyeo 2013 - Nicholas Felton from Eyeo Festival // INSTINT on Vimeo.


posted by jisunlee

보호되어있는 글입니다.
내용을 보시려면 비밀번호를 입력해주세요.

디지털 미디어 컨텐츠 관련 서적 써머리

data_visualization

https://www.interaction-design.org/encyclopedia/data_visualization_for_human_perception.html



posted by jisunlee

베스트 데이터 시각화 툴

http://thenextweb.com/dd/2015/04/21/the-14-best-data-visualization-tools/

 

 

** For Developers
D3.js
FusionCharts
Chart.js
Google Charts
Highcharts
Leaflet
dygraphs

 

** Non-Developers
Datawrapper
Tableau
Raw
Timeline JS
Infogram
Plotly
ChartBlocks

 

 

posted by jisunlee

디지털 미디어 디자인 강의자료

데이터 시각화 강의 동영상

 PBS 의 오프북에서 만든 데이터시각화의 미학 다큐멘터리

 

 

데이터 시각화 관련 작업 및 강의들을 볼수 있는 Datavisualization.ch 비메오 채널

https://vimeo.com/channels/datavisualization

 

프로세싱을 만든  Casey Reas

https://vimeo.com/channels/datavisualization/45851523

 

Eyeo2012 - Casey Reas from Eyeo Festival // INST-INT on Vimeo.

 

 

 

그래픽 퀄리티가 뛰어난 니콜라스 펠톤

Eyeo2012 - Nicholas Felton from Eyeo Festival // INST-INT on Vimeo.

 

 

 

 

 

Designing Data Visualizations with Noah Iliinsky

 

 

 

씨네마4D를 이용한 데이터 시각화 강의 영상  

Cinema 4D Data Visualization from Chris Maynard on Vimeo.

 

 

린다닷컴 데이터 시각화 강의(유료)

http://www.lynda.com/Design-Infographics-tutorials/So-what-data-visualization/153776/170877-4.html

 

 

 

posted by jisunlee

데이터 시각화와 정보디자인

 

 

posted by jisunlee

빅데이터 시각화 - 경영정보학회 발표자료

 

 

posted by jisunlee

TED.com ED 시리즈 : 데이터 시각화

http://ed.ted.com/series/?series=visualizing-data


6개의 비디오로 구성되어 있으며, 각 비디오 마다 5~8문제가 들어 있습니다. 


posted by jisunlee

New York Times 인포그래픽

New York Times  인포그래픽 

http://www.smallmeans.com/new-york-times-infographics/


올림픽 레이싱 인포그래픽 

http://www.nytimes.com/interactive/2012/12/30/multimedia/2012-the-year-in-graphics.html

3D를 이용한 어메이징한 정보디자인 

http://www.nytimes.com/interactive/2012/08/05/sports/olympics/the-100-meter-dash-one-race-every-medalist-ever.html

http://www.nytimes.com/interactive/2012/08/01/sports/olympics/racing-against-history.html

For Yankees, Little Bang for Their Buck

http://www.nytimes.com/interactive/2013/08/02/sports/baseball/bang-for-your-buck.html?_r=0



야구 투수 인포그래픽 영상

http://www.nytimes.com/interactive/2010/06/29/magazine/rivera-pitches.html


뉴욕타임즈의 아만다 콕스의 데이터 시각화 강의 





posted by jisunlee

인포그래픽웍스 회사

http://www.infographicworks.com/




posted by jisunlee

정보디자인 그래프 그리기

출처 : http://online-behavior.com/analytics/chart-types






posted by jisunlee

R 특강 1 - 데이터 불러오기 및 막대 그래프 그리고 PDF로 만들어서 일러로 가져가기

오브젝트를 설정하고 그 안에 데이터를 넣을 수 있고 오브젝트끼리 연산도 가능 

> a <- 1

> a

[1] 1

> b <- 1:10

> b

 [1]  1  2  3  4  5  6  7  8  9 10

> c <- c("a","b","c")

> c

[1] "a" "b" "c"

> d <- 1:10

> e <- 11:20

> d+e

 [1] 12 14 16 18 20 22 24 26 28 30


a 오브젝트 하나만 데이터를 지우려면

> rm(a)

확인해보면... 

> ls()

[1] "b" "c" "d" "e"


데이터를 모두 지울때 

> rm(list=ls(all=T))

> rm(list=ls())

확인해 보면

> ls()

character(0)


> help (mean)

starting httpd help server ... done


hotdogs <- read.csv("http://datasets.flowingdata.com/hot-dog-contest-winners.csv", sep=",", header=TRUE)


데이터 화일 


hot-dog-contest-winners.csv


파인더 윈도우를 열어서 화일 위치를 확인한뒤에 데이터를 읽을 수 있음

> read.csv("/Users/jisunlee/Documents/hot-dog-contest-winners.csv")


이것을 R의 오브젝트(객체)로 만들어서 써야 한다. 이래야 램위에 데이터가 올라가 있고 이것을 가지고 만들 수 있음 

> testhotdogs <- read.csv("/Users/jisunlee/Documents/hot-dog-contest-winners.csv")


이것을 다시 csv화일로 자신의 컴퓨터에 저장 할수도 있음 

> write.csv(testhotdogs, "/Users/jisunlee/Documents/testhotdogs.csv")


원하는 데이터 열 예를 들면 Dogs.eaten 열을 가져오는 코드를 가져 올수 있다. 

> testhotdogs$Dogs.eaten

 [1]  9.10 11.00 11.00 19.50  9.50 11.75 15.50 12.00 14.00 13.00 16.00 21.50 19.00 17.00 20.00 19.50 22.25 24.50 19.00 20.25 25.13 50.00 50.50 44.50 53.50

[26] 49.00 53.75 66.00 59.00 68.00 54.00


만약 연도를 가져 오고 싶다면 

> testhotdogs$Year

 [1] 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009

[31] 2010


head 라는 함수를 쓰면 여섯줄만 데이터를 열어서 볼 수 있음 


> head (testhotdogs)

  Year                       Winner Dogs.eaten       Country New.record

1 1980 Paul Siederman & Joe Baldini       9.10 United States          0

2 1981              Thomas DeBerry       11.00 United States          0

3 1982               Steven Abrams       11.00 United States          0

4 1983                 Luis Llamas       19.50        Mexico          0

5 1984               Birgit Felden        9.50       Germany          0

6 1985             Oscar Rodriguez       11.75 United States          0


table을 이용하여서 2X2 로 표시할수 있음 

신기록을 세우지 못했으면 0 셀에 1이 표시되고 1셀에 1이 표시되면 뉴레코드를 세웠다는 것을 추출해 낼 수 있음 

> table (testhotdogs$Year, testhotdogs$New.record)

      

       0 1

  1980 1 0

  1981 1 0

  1982 1 0

  1983 1 0

  1984 1 0

  1985 1 0

  1986 1 0

  1987 1 0

  1988 1 0

  1989 1 0

  1990 1 0

  1991 0 1

  1992 1 0

  1993 1 0

  1994 1 0

  1995 1 0

  1996 0 1

  1997 0 1

  1998 1 0

  1999 1 0

  2000 0 1

  2001 0 1

  2002 0 1

  2003 1 0

  2004 0 1

  2005 1 0

  2006 0 1

  2007 0 1

  2008 1 0

  2009 0 1

  2010 1 0

 

이것을 막대 그래프로 그리면 핫도그를 먹은 데이터를 그릴수 있음 새창이 뜨면서 막대 그래프가 그려짐. 

> barplot (testhotdogs$Dogs.eaten)


막대그래프에 연도를 넣어서 표시 할 수 있음 

> barplot (testhotdogs$Dogs.eaten, names.arg=testhotdogs$Year)


색상을 빨간색으로 주고, 보더는 빼고, x축과 y축의 라벨을 붙여주는 경우

> barplot(testhotdogs$Dogs.eaten, names.arg=testhotdogs$Year, col="red", border=NA, xlab="Year", ylab="Hot dogs and buns (HDB) eaten")


편집기를 열어서 여러줄의 코드를 쓸수 있음 

R의 위의 아이콘 중에 프린터 아이콘 옆에 있는 빈 문서 아이콘을 선택한 다음에 R편집기를 열어서 여러줄을 코드를 써 볼수 있음 


> fill_colors <- c()

> for(i in 1:length(testhotdogs$New.record) ) {

+   if(testhotdogs$New.record[i] == 1) {

+      fill_colors <- c(fill_colors, "#821122")

+   } else {

+      fill_colors <- c(fill_colors, "#cccccc")

+   }

+ } 



미국인 경우에는 색상이 있는 그래프로, 미국이 아닌경우에는 회색으로 표시됨 

헥사코드 색상을 선택해서 이용할수 있음 

http://0to255.com

위의 사이트에서도 선택가능 


이것을 확인해 보면 아래와 같이 데이터에 따라서 색상이 다르게 표시되는 결과를 볼수 있다. 

> fill_colors

 [1] "#cccccc" "#cccccc" "#cccccc" "#cccccc" "#cccccc" "#cccccc" "#cccccc" "#cccccc" "#cccccc" "#cccccc" "#cccccc" "#821122" "#cccccc" "#cccccc" "#cccccc"

[16] "#cccccc" "#821122" "#821122" "#cccccc" "#cccccc" "#821122" "#821122" "#821122" "#cccccc" "#821122" "#cccccc" "#821122" "#821122" "#cccccc" "#821122"

[31] "#cccccc"


이것을 막대 그래프로 표시해 보면 다음과 같다. 

> barplot(testhotdogs$Dogs.eaten, names.arg=testhotdogs$Year, col=fill_colors, border=NA, xlab="Year", ylab="Hot dogs and buns (HDB) eaten")


타이틀을 넣고 공간을 적당하게 띄어서 표기하고자 하면 아래와 같이 입력하면 됨 

> barplot(testhotdogs$Dogs.eaten, names.arg=testhotdogs$Year, main="Nathan's Hot Dog Eating Contest Results, 1980-2010", col=fill_colors, border=NA, space=0.3, xlab="Year", ylab="Hot dogs and buns (HDB) eaten")


비쥬얼라이즈 디스 그림 4-11 144 페이지의 그래프를 지금 까지 만들어 봤음 


이것을 R에서 그래프를 선택한뒤에 화일을 저장하면  pdf로 저장할수 있고 일러에서 불러서 

그룹을 해제하고 투명 오브젝트를 지운뒤에 원하는 도형을 선택하여서 쓸수 있다. 


데이타 프레임. 글자 문자등이 섞여서 한셀씩 이루어 가는 것

data matrix 데이타 메이트릭스. 데이터 형이 한가지 형태로 되어 있는것. 


> hot_dog_places <- read.csv("http://datasets.flowingdata.com/hot-dog-places.csv",  sep=",", header=TRUE)

> hot_dog_places

  X2000 X2001 X2002 X2003 X2004 X2005 X2006 X2007 X2008 X2009 X2010

1    25  50.0  50.5  44.5  53.5    49    54    66    59  68.0    54

2    24  31.0  26.0  30.5  38.0    37    52    63    59  64.5    43

3    22  23.5  25.5  29.5  32.0    32    37    49    42  55.0    37

우선 데이터를 위처럼 불러오고. 이형태는 데이터 프레임인데. 이걸 계산할수 있도록 데이터 메이트릭스로 바꾸어줌 


> names(hot_dog_places) <- c("2000","2001","2002","2003", "2004","2005","2006","2007","2008","2009","2010")  

> hot_dog_matrix <- as.matrix(hot_dog_places)

> hot_dog_matrix

     2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

[1,]   25 50.0 50.5 44.5 53.5   49   54   66   59 68.0   54

[2,]   24 31.0 26.0 30.5 38.0   37   52   63   59 64.5   43

[3,]   22 23.5 25.5 29.5 32.0   32   37   49   42 55.0   37

그러면 데이터 메트릭스로 바꾸어짐


이것을 가지고 누적 그래프를 그릴 수 있음 

> barplot(hot_dog_matrix, border=NA, space=0.25, ylim=c(0,200), xlab="Year", ylab="Hot dogs and buns (HDBs) eaten", main="Hot Dog Eating Contest Results, 1980-2010")


세개의 색상을 넣는다고 하면 col 을 더 넣어서 지정하면 됨 

> barplot(hot_dog_matrix, border=NA, space=0.25, ylim=c(0,200), xlab="Year", ylab="Hot dogs and buns (HDBs) eaten", col = c(1,2,3), main="Hot Dog Eating Contest Results, 1980-2010")



라이브러리를 불러오고

이것을 로드해야 됨을 잊지 말것 

install.packages("portfolio")

library(portfolio)



새로운 그래프를 검색하고 싶다면 

구글에서 이미지 검색에 아래를 검색단어로 입력하고 선택하여 볼것 

plot in r


ehjamg@begas.co.kr

wjpark@begas.co.kr


posted by jisunlee

프로젝트 R 특강자료

2013.10.01 01:41

보호되어있는 글입니다.
내용을 보시려면 비밀번호를 입력해주세요.

데이터 시각화를 위한 D3.js 투토리얼 동영상

https://www.youtube.com/watch?v=n5NcCoa9dDU


샘플 코드를 이용하여 웹사이트로 뿌려줄수 있습니다. 실시간 에니메이션도 가능합니다. 



posted by jisunlee

일러스트를 이용한 인포그래픽 투토리얼 동영상

일러스트를 이용한 인포그래픽 투토리얼 동영상


자세하게 설명되어서 작업할때 도움이 될것 입니다. 








지도를 그리는 방법 중 첫번째. - 세개의 시리즈로 이루어져 있음 








posted by jisunlee

뎁로이 언어의 탄생 강의 질문

  • http://kyw6693.blog.me/20188978953

    권여울 2013.06.04 00:26
  • http://blog.naver.com/mybean/60193284627

    민영빈 2013.06.04 00:59
  • plumpplum.egloos.com/885254

    강지연 2013.06.04 04:04
  • http://blog.naver.com/heejicucu/120191331215

    양희지 2013.06.04 06:22
  • http://blog.naver.com/happygirl812/80191318888

    백정숙 2013.06.04 06:24
  • http://blog.naver.com/rlagkrud0

    김하경 2013.06.04 06:43
  • http://blog.naver.com/sabina9797/70168940608

    최문정 2013.06.04 07:47
  • http://blog.naver.com/rururu16/130169409273

    이해인 2013.06.04 09:21
  • http://blog.naver.com/chy1206/140190473384

    조현영 2013.06.04 09:27
  • http://blog.naver.com/chatterbox21/50172753205

    최은정 2013.06.04 09:42
  • http://blog.naver.com/ptjyyy/30169243132

    허주연 2013.06.04 09:51
  • http://blog.naver.com/hjy0347/50172754041

    한지영 2013.06.04 09:58
  • http://blog.naver.com/jinhye21/110169410090

    이진혜 2013.06.04 10:25
  • http://blog.naver.com/yunjumar93/90174315501

    황윤주 2013.06.04 12:21
  • http://blog.naver.com/dasom2751/100189706805

    최다솜 2013.06.11 04:49
  • http://rangssol.tistory.com/61

    -신한솔

    Hansol Shin 2013.06.11 07:14 신고
  • http://blog.naver.com/j_tictoc/90174404310

    정유진 2013.06.11 07:53
  • http://blog.naver.com/huangxixi7/80191790072

    황새 2013.06.11 10:45
  • http://emfnsdmlqla7.blog.me/188548610

    friend wheel 추가해서 다시올립니다. 블로그 시간 확인 부탁드려요.

    이지은 2013.06.11 13:59

통계학: 자료 시각화하기

 

학습단위 6: 자료로써의 문서 - 단어의 탄생

 

 

우리의 세계가 점점 도구화되어감에 따라, 우리는 사람들이 말하고 있는 것 사이에 점을 연결하는 것과 발생하고 있는 것이 새로운 사회 구조와 힘을 보게 하는 능력이라는 것 안에서 그들이 말하고 있는 것을 연결하는 것에 가능성을 가진다. Deb Roy

 

From TED:

2011 TEDTalk “Deb Roy: 단어의 탄생을 보라. MIT 매체 실험 베테랑 Deb Roy는 완전히 새로운 수준으로 홈 비디오를 찍었다: Roy는 어떻게 그의 젖먹이 아들이 언어를 배우는지 분석하기 위해 비디오 카메라와 함께 그의 집을 배선했다. 90,000 시간 이상의 장면 분석에서, Roy는 새로운 단어의 습득에 대한 공간과 시간 문제의 기절할 만한 시각화를 확립한다. 게다가 Roy와 그의 팀은 사회 매체 내용의 소유 계약, 무수한 공급 재료로부터 끌어오는 것을 설명하는 것에 같은 기술을 재-의도했다.

 

주요 키워드:

 

세로 자료

Longitudinal data

시간의 주기에 따라 수집된 자료

네트워크 그래프

Network graph

네트워크 자료를 위한 표시. 목적은 모서리로부터 연결되어진 네트워크에서 어떤 두 교점에 연결되어진 교점과 같이 묘사되어진 네트워크에 있다.

비디오 분석

Video analytics

녹화되거나 실-시간 비디오, 또한 Video Content Analysis (VCA)라 불리는 것의 조사 분류하기와 분석

어의 분석

Semantic analysis

말하거나 쓰여진 언어에서의 단어 또는 절에 대한 분석

 

연구과제 문제:

1. Roy는 그의 계획을 위한 중요한 과학적 동기는 어떻게 아동이 언어를 배우는 지 이해하는 것에 이 자연스러운 세로 자료를 사용하는 것에 있었다고 말한다. 떻게 이 자료가 세로인지를 설명하라.

2. Roy의 집안에서는 모두 녹화되는 것과 공간에 조심스러운 사생활 제한을 두는 것에 동의했다. 의사소통과 사회 매체에 대한 Roy의 분석을 위해 그는 공적으로 이용할 수 있는 출처만을 사용했다. 그러나, 그의 발표의 두 부분은 대중적인 논쟁 을 반영한다 - 자료 수집이 사생활에 관련될 때는 언제인가? 당신은 윤리적인 방 법에서 자료가 수집되고 사용된다고 생각하는지 진술하라. 각각의 사례에서 당신의 논거를 간단히 설명하라.

a) 모든 중요한 교통 교차점에서 도시 공간 비디오 녹화자는, 교통 방식의 분석을 위해 공적으로 이용할 수 있는 이러한 자료를 만들었다.

b) 이메일 공급자는 당신의 메시지를 기록하고 저장하고, 당신에게 더 많이 관련된 광고를 보여주는 것에 이러한 자료를 사용한다.

c) GPS 네비게이션 소프트웨어를 만드는 회사는 그들의 사용자의 속도와 위치에 대한 자료를 수집하고, 이러한 자료를 법의 집행 기관에 판다. 법의 집행 기관은 속도 매복을 위한 좋은 장소를 확인하는 것에 이러한 자료를 사용한다.

3. 공적인 매체 내용의 소유 계약을 탐색하기 위해, Roy와 그의 동료들은 각각의 달에 30억 사회 매체 내용을 수집하고 분석하고 있다. Roy는 어떤 다른 사람들이 TV를 보는 것과 온라인에서 말하는 것에 걸쳐 많은 영향을 미치는 것으로 보이는 중요한 사람들을 확인하는 것을 그것이 할 수 있다고 말한다. 당신은 이것에 대해 무엇을 생각하는가? 태연하거나 오싹한가?

4. Roy는 우리의 온라인 의사소통과 어떻게 사건과 매체로부터 실현되는지를 묘사 하는 것에 네트워크 도표를 사용한다. 네트워크 그래프는 교점의 집합과 모서리의 집합에 양립한다. 두 교점은 만약 그것 사이에 어떤 특수한 관계가 있다면 모서리 로부터 결합되어진다. 세 가지 교점 (X,Y, 그리고 Z)과 함께, XY 사이에 모서리 와 함께, YZ 사이에 모서리와 함께한 네트워크 그래프. Roy가 사용한 그래프는 몇몇의 천 개 교점과 다수의 수준과 함께 합성되어질 수 있다. 6명의 학우와 함께 단순한 합성을 고려해보자: Tommy, Larry, Kari, Jerry, JennyEugene. Tommy Kari와 친구이고, JerryJenny와 친구이고, JennyLarry와 친구이고, KariEugene와 친구이다. 만약 그들이 친구라면 모서리로부터 한 사람과 두 사람이 결 합되어지는 것에 해당하는 각각의 교점이 있는, 이러한 자료의 네트워크 그래프를 만들라.

5. Bluefin Labs에서 Roy와 그의 동료들은 사회 매체 출처로부터 발췌된 댓글을 조사하는 것에 의해 보여 지는 어떤 TV 주위에 사회 원동력을 탐색한다. 이것은 자료의 여러 가지 종류를 위한 웹 사이트 스크랩하기예의 하나이다. David McCandless 또는 Blaise Aguera y Arcas 하는 것처럼 스크랩하는 것이 Deb Roy 가 하고 있는 것보다, 또는 같은 것에 대해 더 많이 또는 더 적게 친절하게 보이는 ? 어떤 사례에서, 스크랩하는 것은 어떤 법률과 윤리적인 사건을 제안한다. 예를 포함한다:

BBC: FBI는 사회 네트워크 지도 경보 설득-하는 적용을 계획한다. (1/26/12) (정부)

Taylor Wessig: 로봇 전쟁 - 개인적인 정보를 스크랩하기 (2/2011) (건강 관리)

Bloomberg Law: 새로운 시대 기술: BrazilianU.S. 법정 스크랩하기법률의 인터넷 사용의 경계 (11/09/11) (법인의 경쟁 상대)

스크랩하기는 해킹으로부터 어떻게 다른가? 당신은 왜 개인 또는 조직이 인터넷으 로부터 정보를 스크랩하는 것을 원하는지 다른 동기에 대해 생각할 수 있는가? 중적인 TV 드라마가 당신의 마음에 가지고 있는 시나리오를 제안하는 에피소드를 개발하는 것을 가정하라. ; 에피소드의 요약을 기술하라.

6. 자료와 같은 음향과 영상을 다루는 것의 개념은 생소할지도 모른다. 그러나, 러한 자료의 분석은 현재 연구의 거대한 분야이다. 오디오 자료를 숫자상으로 묘사 하는 것에 대한 일반적인 방법은 시간에 걸쳐 음향 파동의 진폭과 빈도를 측정하는 것에 있다. 예를 들어, 세 가지 일반적으로 말하는 단어를 위한 오디오 신호를 고 려하라: 만약 이러한 단어가 그 밖에 누군가로부터 말해진다면, 그들의 신호는 다 르게 보일 것이다. 같은 세 가지 단어를 위한 오디오 신호는, 다른 사람들로부터 말해진, 아래에 주어진다. 당신은 A에 대응하는, B에 대응하는, C에 대응하는 어 떤 단어를 확인할 수 있는가? (만약 이것을 찾는 것이 어렵다면, 염려하지 마라. AppleGoogle 같은 회사가 어떻게 그들의 오디오 신호로부터 단어를 확인하는 것에 숫자를 표시하는지 여전히 노력하고 있다!)

posted by jisunlee

블레즈 아게라 이 아카스의 강의 질문

통계학: 자료 시각화하기

 

학습단위 5: 자료와 같은 이미지 블레즈 아게라 이 아카스의 포토신스 데모 (Blaise Aguera y Arcas demos Photosynth)

 

우리는 사회 환경과 함께하는 일을 행할 수 있다. 이것은 모든 사람과 -- 전체의 집단적 기억에 의한, 시각적으로, 지구와 같아 보이는 무엇인가에 의한 -- 모든 함께하는 링크로부터 현재 획득하고 있는 자료이다. 모든 사진은 결부되어지고, 그들은 그것의 부분의 합계보다 큰 뜻밖의 무언가를 만든다. Blaise Aguera y Arcas

 

 

 

From TED:

2007 TEDTalk “Blaise Aguera y Arcas demos Photosynth 블레즈 아게라 이 아카스의 포토신스 데모를 보라. TED“가장 놀라운”으로 평가된 하나는 말하기를, MicrosoftBlaise Aguera y Arcas에 의한 Photosynth의 이러한 데모는 우리가 얼마나 시각 자료의 거대한 양을 분석하고 종합할 수 있는지 보여준다. Photosynth는 완전히 사회 매체 사이트로부터 스크랩된 공간적으로-관련된 이미지 속에서 정밀한 지도-제작과 실질적인 조립식의 일순을 촉진한다. Aguera y Arcas 이것이 모든 사람으로부터 자료를 획득하는 것, 지구와 같은 어떤 것의 전체의 집단적 기억으로부터, 그것과 함께 모든 것을 링크하는 것에 비하면 아무것도 아님을 주장한다.

 

주요 키워드:

 

Geospatial

이미지

Geospatial

image

내용의 지리적인 위치에 대한 정보를 포함하는 이미지

플리커로부터

스크랩된 이미지

Images scraped

from Flickr

인터넷의 어떤 위치(또는 위치들)에서 유용한 파일을 통해 컴퓨터가 검색한 자동 과정 - 이러한 경우에 플리커 웹사이트에 저장된 이미지 파일 - 어떤 상세하게 기술된 검색 기준에 적합한 파일로부터 정보를 다운로드하거나 추출하기 위한

메타자료

Metadata

컴퓨터 파일과 결합된 추가적인 정보. 예를 들어, 이미지 파일은 시간, 날짜, 지리적인 위치, 또는 이미지가 생산되었을 때 카메라의 환경에 대한 정보를 포함할지도 모른다.

네트워크 효과

Network effect

더 많은 사람들이 그것을 사용하는 것과 같은 서비스의 사용자가 증가하는 것에 대한 이익이 있는 현상. 이러한 TED talk에 관하여, 더 많은 사람들이 이미지를 공유하는 것과 연결의 더 큰 다양성이 그들 사이에서 만들어질 수 있는 것과 같은, 각각의 이미지의 가치와 정보가 증가한다.

파노라마식

이미지

Panoramic

image

특히 넓은 국면 비율과 함께한 사진, 시야의 산출하는 지면은 충분한 3600 회전에 이르기까지, 보통의 시력보다 더 넓어질 수 있다. 이것은 특별한 렌즈 , 디지털 과정, 또는 다수의 사진을 합병하는 것으로부터 그 위에 함께 성취되어진다.

실질적 모형

Virtual model

물리적 대상 또는 과정을 위한 컴퓨터-산출된 접근은 사용자가 그것의 특성을 연구하는 것을 허락한다.

 

연구과제 문제:

1. Aguera y Arcas에 따르면, Photosynth 기술의 효과 선은 무엇인가?

2. Aguera y ArcasTED talkTED최고의 사설-낙하물이 말하는 것의 하나를 숙고되어진다. 당신은 어떤 것을 생각하는가?

3. 이러한 TEDTalk에서, 우리는 플리커(Flickr.com)로부터 스크랩된이미지를 사용하는 노트 르담 성당의 디지털 재건을 본다. 이것이 일반적으로 사진의 디지털 기록을 통해 컴퓨터 검색에 의해 행해질 때, 당신은 많은 더 작은 척도에서의 과정을 위해 매우 거친 느낌을 가질 수 있다. 유명한 명소, 건물, 또는 여행자 목적지(예를 들어, 유의 여신상)를 정하고, 플리커 웹사이트(또는 사용자의 웹에서 이미지를 위해 검 색하는 것에 어떤 다른 방법)에 가서 당신의 주제에 관련된 이미지를 위해 검색하 . 최소한 12개의 이미지, 주제와 결합될 때의 더 많은 시각화를 제공하는 다른 시각을 보여주는 것을 찾으라.

4. 얼마나 Photosynth 기술이 실제 토지 취급인으로부터 사용되어질 수 있을지를 묘사하라. 어떤 개념을 위해, Barrett Powell로부터 블로그에 게시된 실제 토지에 BindMicrosoft Photosynth를 사용하는 것을 조사하라

5. Microsoft Photosynth를 거쳐 아이폰윈도우 폰을 위한 그것의 사이트 또는 그것의 무료 앱을 탐색하라. 다른 사용자가 제공해온 Synth들을 탐색하고, 당신의 지역사회에서 무언가의 Synth를 창조하라.

무료 계정을 위한 Photosynth 소프트웨어와 회원 가입을 다운로드하라.

디지털 그림(아마도 교실 주위의 다른 시야)의 집합, 그림의 부분을 맞추는 것과 함께 일하는 것에 hotosynth 소프트웨어가 무언가를 가질 수 있는 이미지 사이에 중복을 허락하는 것에 주의하는 것을 창조하라. 일반적인 폴더에서 모든 그림을 위 한 파일을 두라.

Photosynth 소프트웨어를 시작하고 당신이 원하는 것을 포함하는 사진을 선택하 는 것에 조종하는 것으로 사진 추가하기단추를 사용하라.

사진의 집합에 이름을 주고 Photosynth 웹사이트로부터 관찰되어질 수 있는 photosynth를 창조하는 것에 “Synth” 단추를 클릭하라.

 

Further reading and related resources:
• Sheridan, B. (2008, January 26). Like a super hero. Newsweek.
• Pogue, D. (2011, April 27). Camera whimsy on iPhones. The New York Times.
• Manjoo, F. (2009, January 27). All I wanna do is zoom zoom zoom zoom. Slate.
• Style is Violence [Blaise Aguera y Arcas’s blog] http://styleisviolence.com/
• Microsoft Partners in Learning: Photosynth tutorials and classroom activities http://www.pil-network.com/Resources/Tools/Details/bfb692e8-fc57-4568-b209-b5dc4f83389b
• Shoothill and MSN: Interactive guide to the Battle of Britain http://news.uk.msn.com/in-depth/world-war-two/battle-of-britain/default.aspx
• NASA: International Space Station Photosynths http://www.nasa.gov/externalflash/photosynth/index.html

 

 

강의 자료 영문 출처 : http://www.wiley.com/WileyCDA/Section/id-814251.html

번역 : 김지희 교육조교(숙대 음악치료대학원) 번역감수: 이지선 교수(숙대 시각영상디자인학과)

posted by jisunlee

[디지털 미디어 컨텐츠]데이터 시각화와 정보 디자인

 

데이타 시각화와 정보디자인 from Ji Lee

 

2012년 kmobile 발표 자료

- 데이터 시각화

- 정보 시각화

- 정보디자인과 인포그래픽

- 정보디자인의 10단계 프로세스

- 정보디자인과 빅데이터  

 

posted by jisunlee

보호되어있는 글입니다.
내용을 보시려면 비밀번호를 입력해주세요.

[디지털 미디어 컨텐츠1]나탈리 미에바크 강의 질문

원문 첨부 


통계학: 자료 시각화하기


학습단위 3: 과학적 데이타 재상상하기 — 폭풍으로 만든 예술  



내가 이 작업에 대해 사랑하는 것은 그것이 과학과 대조하여, 예술의 세계에 사는 시각 표현 수단의 어떠한 종류에 대한 우리의 가정에 도전하는 것이다. 여기 이 부분을 매우 다르게 읽는 것은 당신이 그것을 어디에 두느냐에 좌우되고 있다. 당신이 그것을 예술 박물관에 두면, 그것은 조각이 된다. 당신이 그것을 과학 박물관에 두면, 그것은 자료에 대한 세 가지 차원의 시각화가 된다. 당신이 그것을 음악 홀에 두면, 그것은 돌연 음악적인 악보가 된다. – Nathalie Miebach



From TED:

2011 TEDTalk의 “Nathalie Miebach 나탈리 미에바크:폭풍으로 만든 예술”을 보라. 예술가 Nathalie Miebach는 세 가지-차원의 공간에서 기후 자료를 표시하는 것에 갈대와 구슬을 함께 짠다. Miebach의 조각 형식은 온도, 풍속, 기압, 운량, 그리고 다른 폭풍 통계학에 대한 자료의 합병이다. 결과는? 당신이 이전에 전혀 듣지 못했던 어떤 것과도 같지 않은 매우 노력한 흔적이 있는-통계학 소리의 퍼짐과 음악적인 악보 날씨이다.





 주요 키워드 

 

다변량 자료
Multivariate data

 각각의 자료 사례에 대해 몇몇의 문제를 기록하거나 측정한 자료 - 폭풍 동안 시간에 따른 각각의 점을 위한 풍속, 기압, 그리고 온도와 같은

삼차원 도표
Three-dimensional
graph

 표시는 세 가지 축을 따라 위치한 자료 점과 같은 세 가지 변수를 보여준다: 높이, 폭 그리고 깊이



연구과제 문제:

1. 왜 Miebach는 바구니를 그녀의 매체로 선택했나?


2. 많은 자료 표시 “읽기” 는 시각의 감각에 완전히 의존한다. 시각에 더하여, Nathalie Miebach의 작업은 자료를 경험하는 것에 다른 어떤 감각을 요구하는 것에서 유일한 무엇이다.


3. TEDTalk에서 Miebach가 증명한 것과 같은 신체적이거나 음악적인 창조물과 함께 표시하는 것에 흥미 있을지도 모르는 어떤 다 변량 자료 위치 (기후와는 다른)에 대해 생각하라. 어떤 변수가 당신이 표시하기를 원하도록 하는가? 당신은 어떻게 그러한 변수의 각각을 위해 값을 표시하는 것에 한 부분 (신체적이거나 청각적인) 을 디자인할 수 있는가? 얼마나 당신은 변수에 대한 각각을 위한 값을 표시하는 것에 조각 (신체적이거나 청각적인) 을 설계할 수 있을까?


4. Nathalie Miebach도 David McCandless도 영역 밖으로부터 통계학과 자료 시각화 둘 다에서 온 전문가 통계학자는 아니다. 왜 Miebach와 McCandless 각자는 자료 시각화에서 흥미로워지며, 그리고 당신은 전문가 통계학자가 그들의 작업으로부터 배우는 것에 대해 어떻게 생각하는가?


5. 다른 예술가와 과학자는 과학적인 자료에 대한 예술적인 시각화를 어떻게 창조하고 있는지 탐구하라. 당신 자신의 지역사회가 적당한 전시회를 주최할 수 있을지 모르는 박물관 위치나 다른 입장, 아래에 web sit 중 하나를 방문하라. 지방 또는 전 세계의 과학적인 자료에 대한 당신 자신의 예술적인 시각화를 발전시키는 것이나 당신이 마주치는 시각화/예술작업 중 하나에 대한 반응을 기록하라. NOAA’의 National Climatic Data Center 또는 NCAR’의 CISL Research Data Archive와 같은, 웹 사이트의 다수는 역사적인 날씨 자료의 많은 것에 접근을 공급한다.

        장소 & 공간: 과학 지도화

        아름다운 과학

더 깊은 정보로 들어가기 위해 과학자와 기술자가 그들의 자료에 대해 도표 표시를 하지 않을 수 없는 창조를 어떻게 할 수 있는지, 시각 전략을 조사하라: Felice Frankel과 Angela DePace로 부터의 Practical Guide to Graphics for Scientists and Engineers (예일 대학교 출판부, 봄 2012) 그리고 그들의 안내서 web site visual-strategies.org.


6. 음악적인 악보와 같이 어떤 자료를 표시하는 것에 대해 생각하라. 당신이 다른 변수를 묘사하는 것을 조절하는 것에 어떤 음악의 문제가 있는가? 어떤 음악적인  악보에서 세 가지 다른 변수를 위해 당신은 어떻게 정보를 기호화할 것인가?


7. 스스로 시도하라! 당신을 흥미롭게 하는 어떠한 자료를 찾아라 - 아마도 당신이 좋아하는 스포츠 팀의 최후의 한 게임에 대한 점수 또는 최후의 10일 중 각각을 위해 당신이 공부한 시간의 숫자 또는 알파벳 순서로 당신의 수업에서 각각의 학생        의 가족 중에 아동의 숫자. 순서에 의한 숫자를 놓는 것과 표준 음악적인 척도의 음표에 대한 그것의 값을 지도를 만드는 것과 같은 하나를 골라잡으라 (야구에서 0 득정 = 가온 도 그리고 각각의 추가의 득점을 위한 하나의 음표를 올라간다). 음악적인 악보로부터 당신의 자료를 번역하라. 만약 당신이 음악적인 악기에 접근한다면, 당신의 악보를 연주하는 것을 시도하고, 또는 당신의 자료-산출된 음악적인 악보에 들어가서 듣는 것을 www.plernpiano.com/piano.php 하나와 같은 온라인 체계를 사용하라.


8. Miebach의 talk는 해양-성 기후 부표로부터 취해진 자료를 언급한다. 현재의 web 기술과 함께 우리는 건조 지역의 조력으로부터 실-시간에 이러한 앞-바다와 함께 의사소통할 수 있다. 예를 들어, 부표로부터 실-시간 그리고 역사적인 자료에 접근하는 것에 우리를 허락하는 많은 기후 부표에 들어갈 수 있는 링크와 함께 아래에 하나와 유사한 지도를 보여주는 NOAA의 National Data Buoy Center를 위한 웹 사이트에 시도하라. 지도 주위를 확대시키고, 흥미로운 위치를 골라잡고, 당신이 찾을 수 있는 것이 무엇인지 보라.




강의 자료 영문 출처 : http://www.wiley.com/WileyCDA/Section/id-814251.html

번역 : 김지희 교육조교(숙대 음악치료대학원) 


1.      Neither Nathalie Miebach nor David McCandless is a professional statistician—both come to statistics and data visualization from outside the field.  Why did Miebach and McCandless each become interested in data visualization, and what do you think professional statisticians could learn from their work?

2.      Why did Miebach choose baskets as her medium?

3.      Think of some multivariate data situation (other than weather) that might be interesting to display with a physical and/or musical creation such as Miebach demonstrates in the TEDTalk.  What variables might you want to display?  How might you design a piece (either physical or auditory) to display values for each of those variables?

4.      Explore how other artists and scientists are creating artful visualizations of scientific data.  Visit one of the web sites below, or locate a museum or other venue in your own community that might be hosting a suitable exhibit.  Write a response to one of the visualizations/artworks you encounter, or develop your own artistic visualization of local or global scientific data.  A number of websites, such as the NOAA’s National Climatic Data Center or NCAR’s CISL Research Data Archive, provide access to lots of historical weather data.  Places & Spaces: Mapping Science
Beautiful Science

For more in-depth information on how scientists and engineers can create compelling graphic representations of their data, check out Visual Strategies: A Practical Guide to Graphics for Scientists and Engineers (Yale University Press, Spring 2012) by Felice Frankel and Angela DePace and its companion web site visual-strategies.org.

5.      Try it yourself!  Find some data that interests you – perhaps the scores of the last dozen games of your favorite sports team or the number of hours you studied for each of the last 10 days or the number of children in the family of each of the students in your class, in alphabetical order).  Pick one such set of ordered numbers and map its values to the notes of a standard musical scale (e.g. 0 runs in baseball  = middle C and go up one note for each additional run).  Translate your data into a musical score.  If you have access to a musical instrument, try playing your score, or use an online system such as the one at Plern Piano to enter and then listen to your data-generated musical score.


posted by jisunlee

[디지털 미디어 컨텐츠1]한스 로슬링 강의 질문

통계학: 자료 시각화하기

 

학습단위 2: 자료 이동하기 - 당신의 세계관을 바꾸는 통계학

 

스웨덴의 수석 학생들은 침팬지보다 못하게 세계에 대하여 더 낮게 통계적 유의도를 이해한다. – Hans Rosling

 

 

 

 

From TED:

2006 TEDTalk “Han Rosling: 한스 로슬링이 이제껏 보지 못했던 최고의 통계를 보여준다.”을 보라. 통계학 권위자 Han Rosling은 공적자금를 자유롭게하고 에니메이션(움직여서 보여주는) 것에 대한 사명을 가지고 있다. 이러한 경이로운 대중적이고 장난스런 TEDTalk, Rosling의 상호작용의 묘사는 세계를 개발하는 것에 대한 신화를 폭로하는 아동의 사망률, 출생률, GDP과 더 많은 다른 자료의 수 십년간 을 활성화여 보여준다.

 

주요 키워드:

 

산점도

Scatterplot

두 수의 변수를 위해 자료를 도표에 표시한다. 도표는 각각의 변수에 대한 하나의, 적합한 수의 척도와 함께 축의 한 쌍을 포함한다. 각각의 사례를 위해 짝지은 자료는 산점도(scatterplot) 위에 점과 같이 분할된다. 색-부호화(coding)는 또한 자료에 대한 추가의 면을 표시하는 것에 사용되어지곤 한다.

버블  차트

Bubble chart

각각의 작은 점의 면적인 산점도(scatterplot)은 세 번째 수의 변수에 대해 비례한다.

모션차트

Motion chart

역동적 산점도(scatterplot) 또는 버블차트가 시간에 따라 어떻게 자료가  변하는지를 보여준다.

신뢰구간

Confidence

interval

구간은 알 수 없는 값을 포함하는 것에 대해 우리가 예정한 표본 자료로부터 계산되었다. 신뢰구간은 시간에 의해 명세서에 기입된 몫인 (보통 95%) 실재 값을 획득할 방법으로 사용하는 것으로 구성되어진다.

통계상 유의도

Statistically

significant

자료로부터 관찰된 효과는 단일의 랜덤 기회로부터 발생되는것과는 다르다는 것을 가리킨다.

 

 

연구과제 문제:

1. Rosling이 아동 사망률과 세계를 개발하는 것에 대한 그의 학생들의 이해에 대해 이야기할 때, 그는 “무지가 문제가 아니라; 그것은 편견 때문이였다.”는 문제를 말한다. 그가 그의 학생들에게 주었던 시험의 결과는 이것을 어떻게 뒷받침 하는가?

 

2. Rosling은 인터넷상의 “자유롭고” 그리고 “에니메이션 되는” 공적자금에 대한 열의에 찬 옹호자이다. 인터넷상에서 비교되어 있수 있는  (교육, 보건, 식품 생산, 환경 등) 하나 선택하고, 인터넷의 이러한 영역에서 당신의 생각하기에 이러한 영역에 대하여 가장 좋은 출처라고 정하라. 이러한 출처의 목록에 대한 가이드를 창조하고 각각에 대한 간결한 리뷰를 제공하라.

만약 이러한 자료 저장소의 관리자가 어떻게 모바일 장치 또는 사회 매체를 통하여 사용자가 데이터가 관여하는지를 생각하고 있다면, 리뷰에 이것을 기록하라. 만약 현재 관리자가 이러한 영역에서 어떠한 것도 하지 않고 있다면, 모바일 장치와 사회 매체가 사용자의 경험을 향상할 수 있을지에 대해 당신은 어떻게 생각하는가?

 

 

3. Rosling의 Gapminder World software에서 국가의 자원과 보건 도표를 열어라. 이 도표를 단순화하기 위하여, 오른쪽의 모퉁이 밑바닥에서 ‘Size’ 탭 아래의 ‘One Size’를 선택하라. 2011년 에 대한 자료를 표시하는 도표가 만들어짐을 명심하라. (연도는 도표의 바닥에서 슬라이더를 사용하여 변화시킬수 있다.)

 

이것은 두 가지 수의 변수(생활 기대 값과 1인당 GDP)를 위해 자료를 표시한, 산점도(scatterplot)에 대한 보기이다. 도표는 각각의 변수를 위한 하나의, 적합한 수의 척도와 함께 축의 한 쌍을 포함한다. 각각의 국가를 위해 짝지은 자료는 흩뿌려진-도면 위에 점과 같이 위치가 결정되어진다.

 

국가의 이름을 표시한 도표에서 점 위의 표시화면 내용을 순차적으로 올려라.

a) 어떤 국가가 2011년에 최저의 1인당 GDP를 가졌는가?

b) 어떤 국가가 2011년에 가장 높은 생활 기대 값을 가졌는가?

c) 일반적으로, 높은 1인당 GDP를 가진 국가는 더 높거나 더 낮은 생활 기대 값을 가지는 경향이 있는가?

 

4. 도표 위쪽의 오른쪽 구석 아래에서 ‘Size’ 태그 아래에, ‘지표’ -> ‘인구’ -> ‘인구, 합계’ (‘Indicators’ -> ‘Population’ -> ‘Population, total’) 를 선택하라. 현재, 각각의 작은 점의 영역이 국가의 인구 총합과 비례한다. 각각의 작은 점의 영역과 같은 (인구) 새로운 변수를 포함하는 것으로 부터, 우리는 버블차트를 만들었다.

a) 어떤 국가가 2011년에 더 큰 인구를 가졌는가?

b) 만 달러보다 큰 1인당 GDP를 가진 어떤 국가가 2011년에 더 큰 인구를 가졌는가?

 

5. 1800년부터 현 시대까지 자료가 얼마나 변하는지를 보기 위해 도표의 왼쪽 아래에서 ‘Play’ 아이콘을 클릭하라. 이 모션차트는 한 번에 몇몇의 변수 (기대 수명, 1인당 GDP, 인구, 시간) 사이에 관계를 탐험하는 것에 우리를 허락한다.

a) 어떤 국가가 1900년부터 1929년까지 가장 높은 1인당 GDP를 가졌는가?

b) 일반적으로, 1800년부터 2011년까지 기대 수명은 증진하거나 감소하는 경향이 있는가?

c) 일반적으로, 1800년부터 2011년까지 인구는 증가 또는 감소한 경향이 있는가?

d) 이 도표는 지나간 200년에 이르는 자원과 보건에 대한 많은 정보를 전달한다. 당신이 특히 흥미롭거나 놀랍게 찾은 도표에서의 정보에 대한 한 부분은 무엇인가? (옳고 그름의 답이 없다.)

 

 

다음 연구과제 문제는 신뢰구간통계 유의도를 소개한다. 이것은 통계학에서 중요한 개념이고, 충분히 이해하는 것에 시간을 취할 수 있다. 만약 당신이 더 배우는 것에 흥미롭다면, 아래에 추가의 출처를 조사하여 확인하라.

 

 

6. Rosling은 5가지 문제로 이루어진 하나의 퀴즈를 수업에 주고, 이 학생들이 1.8점의 옳은 문제에 대한 평균을 얻는다. 만약 Rosling이 이 수업에서 학생의 다른 한 조에게 같은 퀴즈를 준다면, 그들의 평균 점수가 다시 정확하게 1.8점이 될 가망은 없다. 약간 더 높거나 약간 더 낮을 수 있다. 우리는 자료에서의 변이성이 있는 민감한 결과를 어떻게 측정할지에 신뢰구간(CI)을 사용할 수 있다. 표시는

 


우리가 실재 평균 점수(말하자면, 전 세계의 보건에 대한 스웨덴의 대학생 초기 교육과정에 있어서)가 1.4점과 2.2점 사이의 어딘가에 있다는 것을 제외할 수 있다는 것을 우리에게 말한다. 전형적으로, 이러한 것과 같은 신뢰-구간은 시간에 대한 실재 값 95%를 획득할 방법을 사용하는 것으로 구성되어지고, 우리는 이 구간 안에 있는 실재 평균인 “95% 신뢰”가 있다.

a) 신뢰-구간 위에 기초하여, 스웨덴의 학생이 이러한 다섯 가지 문제가 주어졌을 때 무작위로 추측하는 것이 가능한가? (무작위 추측하는 것이 2.5의 평균 점수에서 결과로서 일어나는 것을 기록하라)

 

 

b) 가능하다고 생각되는 투표자의 작은 조사에 기초하여, 정치의 후보자를 위해 투표하는 것을 계획하는 사람들의 백분율을 위한 신뢰-구간은 52%±5%이다. 모든 가능하다고 생각되는 투표자들이 후보자를 위해 투표하는 것에 대한 계획의 반(50%)보다 더 적을 것 같은가? 모든 가능하다고 생각되는 투표자들이 후보자를 위해 투표하는 것에 대한 계획의 75%보다 더 많을 것 같은가?

 

7. Rosling은 스웨덴의 학생이 “통계상 유의성이” 그의 퀴즈에서 침팬지보다 나쁘다는 것을 말한다. 우리는 결과가 랜덤 기회로부터 일어나는 결과와 같지 않다면 통계상 유의하다고 말한다. 그리고, Rosling은 만약 학생이 랜덤 (침팬지와 같이) 추측하고 있다면 그들의 평균 점수가 그렇게 낮을 가망이 없다고 말하고 있다.

 

통계상 유의도의 개념은 신뢰-구간(문제 4 위쪽에 (a) 부분을 보라)에 관계가 있다. 또한 정확히 어떻게 단지 무작위 기회로부터 일어나는 것에 대한 결과가 있는 가망 없는 결정을 하는 것에 도움이 된다. 우리는 Rosling의 퀴즈 자료를 위해 이것을 할 수 없을 것이지만, 그 대신 다른 예를 숙고한다:

 

개는 그의 소유자와 닮을까? 실험의 참가자는 두 개의 사진과 함께 개의 소유자의 사진을 보게 되었다 - 소유자의 개와 연구로부터 무작위 선택된 다른 개. 연구에서 25마리의 개의 소유자를 포함하여, 사진에 기초한 그들의 개와 함께 그들에 대해 16명의 참가자를 바르게 짝지었다.

 

이 연구는 참가자가 무작위 추측하는 것보다 더 나은 통계상 유의한 증거를 주는가? 만약 참가자가 무작위 추측되어지는 것이 그들의 선택이 동전의 공중제비와 같다면: 그들이 반시간은 옳을 것이고 그들이 반시간은 틀릴 것이다. 그들이 무작위 추측으로부터 16개 또는 25개 이상을 맞추는 것은 가능하고, 우리는 단지 이것이 무작위 추측 아래 결과를 가장하는 것으로부터 얼마나 가능하다고 생각하거나 가망 없다는 것을 결정할 것이다. 아래에 단계를 계속하라:

 

a) 웹 applets StatKey를 열어라. 그리고, ‘무작위화 가설 시험Randomization Hypothesis Tests’ 아래 applet ‘단 하나의 비율을 위한 시험Test for a Single Proportion’을 열어라. 연구 위쪽으로부터 자료가 스크린의 오른쪽에 나타날 수 있다. 바르게 선택한 비율이 16/25 = 0.640 였던 사람을 기록하라.

 

 

 

b) ‘사례 1 산출하기’ 단추를 클릭하라. 이것은 만약 참가자가 무작위 추측했다면, 스크린의 오른쪽에서 ‘무작위화 사례’ 아래 주어진 결과로 일어났다고 할 수 있는 다른 데이터 셋을 산출한다. 어떤 비율을 이 시뮬레이트된 데이터 셋에서 바르게 선택할 것인가?

c) 실재 결과가 얼마나 가망 없는지를 결정하기 위하여, 우리는 무작위 추측 아래에 많은 가능한 데이트 셋을 가장하는 것이 필요하다. ‘1000개 사례 산출하기’를 클릭하는 것으로부터 이것을 하라. 이러한 가장된 데이터 셋의 각각에서 바르게 추측한 사람의 비율은 도표에서 보여주는 작은 점과 같이 주어진다(그러므로 1000개의 작은 점이 있다). 0.640 또는 더 많은 비율에서 결과된 이러한 자료집합의 많은 것이 얼마나 바르게 추측하는지를 결정하는 것에, 잘려-나간 수와 같은 0.640에 들어간 수평 축 아래 파란 상자에서, 도표의 꼭대기에 ‘오른쪽 꼬리’를 대조하라. 0.640이거나 더 많은 것의 비율에서 결과된 1000개의 가상의 비율은 파랑 상자 위쪽에서 주어진다.

 

 

0.640이거나 더 많이 바르게 추측된 것의 비율에서 결과된 가상의 비율은 무엇인가?

d) 당신의 분석 위에 기초하여, 당신은 이 실험에 대한 결과가 통계상 유의하다고 생각하는가? 왜 그렇거나 왜 그렇지 않은가?


관련 자료

• Rosling, H. (2007). Visual technology unveils the beauty of statistics and swaps policy from dissemination to access. Statistical Journal of the IAOS, (24)1-2, 103-104.
• Schell, O., Reilly, M., Rosling, H. Peterson, S. and Ekstrom, A.M. (2007). Socioeconomic determinants of infant mortality: A worldwide study of 152 low-, middle- and high-income countries. Scandanavian Journal of Public Health, 35(3), 288-297.
• Grimes, S. (2007, January 1). Breakthrough analysis: Make your data tell a story. Information Week.
• Suarez, R. (Host). (2012, January 30). Hans Rosling brings life, humor, sword-swallowing to global health statistics. In PBS NewsHour. MacNeil/Lehrer Productions.
• The Economist Technology Quarterly (2010, December 9). Brain scan: Making data dance.
• Baron, A. (Producer) and Hillman, D. (Director). (2010). The joy of stats [Documentary].
• Fjällström, P. (Director). Rosling’s world [Documentary].
• TED (Producer) and Rosling, H. (Presenter). (2012). Hans Rosling: Religions and babies [Video].
• TED (Producer) and Rosling, H. (Presenter). (2007). Hans Rosling: New insights on poverty [Video].
• Lock, R.H., Lock, P.F., Lock Morgan, K., Lock, E.F. & Lock, D.F. (2012). Statistics: Unlocking the Power of Data. London: Wiley.
• Google Public Data Explorer http://www.google.com/publicdata/directory


강의 자료 영문 출처 : http://www.wiley.com/WileyCDA/Section/id-814251.html

번역 : 김지희 교육조교(숙대 음악치료대학원) 번역감수: 이지선 교수(숙대 시각영상디자인학과)

posted by jisunlee

[디지털 미디어 컨텐츠1] 데이비드 맥캔들레스 강의에 대한 질문

통계학: 자료 시각화하기

 

학습단위 1: 대량의 자료를 사용해 감각 만들기: 자료 시각화의 미(美)

 

우리는 정보 과부하나 자료 과다로부터 비롯된 모든 괴로움에 있는 것을 느낀다.

좋은 소식은 그것에 대한 쉬운 해결이 있을지도 모른다는 것이고, 그것은 우리의 눈을 더 사용하는 것이다. - David McCandless

 

 

 

From TED:

 

2010 TEDTalk “David McCandless: 자료 시각화의 미(美)”를 보라. 정보 시대에서, “자료는 새로운 토양이다”, 라고 David McCandless는 선언한다. 저널리스트에서 디자이너에 이르기까지 이 토양에서 - 그것이 군용으로 쓰이는 것이거나 Facebook 상태를 업데이트 하는 것이든지 - 놀라운 방법으로 뒤섞인 정보를 시각화하여 수집하는 일을 한다.

 

주요 키워드:

 

절대 량

Absolute quantities

절대량은 조절 없이, 원본 척도로 측정되어 진다. 예를 들어, 국가에서의 군대에서 쓰이는 절대 량은 국가에서 군용에서 소비한 전체의 dollar 총액이다.  absolute 절대"라는 것은 상대 량과 구별된다.

상대 량

Relative quantities

상대적인 분량은 합계의 백분율과 같은 양으로 주어진다. 우리는 어떤 전체 총액으로부터 절대 값의 분량을 나누는 것에 의한 상대적인 분량을 찾는다. 예를 들어, 국가에서의 군용 소비에 대한 상대적인 분량은 국가에서의 소비 합계의 백분율에 있을 것이다.

예를 들어, 국가에서의 군용 소비를 위한 상대평가의 분량은 국가에서 군용에 대해 소비했던 것에서 전체의 소비에 대한 백분율에 있을 수 있다. 우리는 국가의 예산 합계로부터 절대 값을 나누는 것에 의한 상대 량을 찾는다.

Per capita

라틴어의 표현은 “per person 사람에 따라서”를 의미하는 것. 연구 과제 문제 #3의 아래를 보라.

자료 모으기

Scraping data

web에서 하나 이상의 출처로부터 자료를 발췌하고 더 쉽게 분석되어지는 형식에 그것을 재구성하라. 

자료 조사하기

Data mining

거대한 데이터 셋들에서 패턴, 그리고 다른 흥미로운 현상을 발견하라.

풍선 진행 도표

Balloon race diagram

풍선의 높이에서 자료를 표시하는 것의 방법은 하나의 변수를 표시하고, 왼쪽에서 오른쪽 풍선의 위치는 다르게 표시할 수 있고, 풍선의 크기는 다른 변수를 표시하고, 표시는 시간이 지나며 변화한다. 또한 추가의 변수에 의한 색-부호화가 있을 수도 있다. 이것은 또한 동작 도표나 역동적 기포 도표라고도 불려진다(뒤따르는 Hans Rosling에 의한 TEDTalk를 보라).

 

연구 과제 문제:

1. McCandless는 정보 과부하, 회의론, 신뢰의 붕괴, 투명도와 신뢰도의 결핍을       포함, 우리 사회에 정보 문제가 많이 있다고 생각한다. 가장 효과 있는/있을 문제가 되는 것이 어떤 것이라고 생각하는가?

 

2. 영양 보충에 대한 그의 정보도표를 디자인하기 위해서, McCandless 1,000   의 의학 연구에 대해 재고하고 시각을 디자인하는 것에 한 달이 걸렸다. 이 놀라운     노력의 수준에 대해서, 그것이 가치라고 생각하는가? McCandless의 웹사이트에서 인터렉티브 버전을 시험해보라.

Snake Oil

http://www.informationisbeautiful.net/visualizations/snake-oil-supplements/

무엇이 마음을 끌거나 놀라게 하는가? 어떤 것이 사용자 경험을 향상시키기 위해서 변화하게 하는가? 간단 리뷰를 써 보아라.

 

3. McCandless에 의해 제공된 시각의 많은 것이 숫자를 표시하는 모양은 2차원      영역을 사용한다. 예를 들어, 그의 “10 Dollar o-Gram"은 직사각형의 영역과 같은 매우 큰 dollar 총액을 표시한다. 대륙으로부터의 인구에 대한 아래의 자료를 고려하라.

대륙

인구수 (Billions)

아시아

4.22

아프리카

1.07

/남 아메리카

0.94

유럽

0.74

오세아니아

0.04

            

4. 정사각형의 영역과 같은 각각의 대륙의 인구를 표시하는 두 가지 도표를 만들라    (이 도표는 쉽게 손으로 만드나, 더 큰 자료집합을 위해서는 기술이 도울 수 있다!)

a) 서로의 옆에 각각의 대륙을 위한 정사각형을 표시하라

b) 서로의 안쪽에 차례로 끼워 정사각형을 배치하라(McCandless에 의해 사용된 “Sensory Bandwith" 시각에 유사한 것).

 

5. 자료를 표시하는 것에 가끔 다양한 방법이 있고, “최선”의 방법은 가끔 어떠한      주어지는 데이터셋에 대한 의견의 문제를 제시하는 것이다. 대륙 인구에 대한 자료의 두 가지 추가적 디스플레이를 고려하라, 막대도표(c)와 파이차트(d).

 

    

당신의 견해로 본다면, 어떤 그래프(a, b, c or d)가 가장 효과적으로 정보를  표시하는가?

이 자료를 위한 다른 시각 디스플레이에 대해 생각할 수 있는가?

 

 6. MacCandless는 얼마나 절대 값의 숫자(군용 예산과 각 국가의 상비 군대와 같    )가 오해하게 할 수 있는지를 보여준다. 가끔 그것의 GDP에 대한 백분율처럼 국가의 군용 예산과 같은 상대적인 숫자, 또는 전체의 인구에 대한 백분율 같은 군대       는 더 의미가 있다. 상세하게, 절대 값의 분량은 사람들에 대한 전체의 숫자에 의해 나눌 때 사람들의 집단을 묘사하는 것에 더 의미 있을 수 있다; 라틴어의 표현 per capita(거칠게 번역하여 “사람에 따라서”)는 가끔 그러한 상대적인 분량을 묘사하는 것에 사용되어진다.

 

아래에 각각의 분량이 얼마나 더 의미 있는 상대적인 비교를 위해 허락하는 것에 기준화될 수 있는지 묘사하라. (하나 이상의 조건에 맞는 답이 있을 수 있다!)

              a)         리터(liter), 국가 안에서 날마다 소비된 커피에 대한 전체의 총액

              b)         핸드폰 사용자가 가진 부재중 전화에 대한 전체의 숫자.

              c)         사람들이 자선에 기부한 돈에 대한 전체의 총액.

              d)         농구 선수가 만드는 자유 투구에 대한 전체의 숫자.

 

7. McCandless는 절대 값의 숫자는 상대적인 숫자처럼 뜻이 있지 않다고 말하고     그는 군용 소비에 대한 자료와 그의 점수를 만드는 것에 군대 크기를 사용한다[10:26]. 당신은 매체에서 보고된 가장 큰 숫자에 대해 어떻게 생각하는가? 당신이 얼마나    매체가 더 높은 교육에 대한 통계학을 보고하는지를 고려할 때, 절대 값과 상대적인 숫자가 다른 결론을 끌어내는 것에 사람들을 얼마나 이끄는지에 대한 예가 있는가? 몇몇을 조사하고, 예를 찾아내고, 객관적으로 보고한 집합에서 표시를 디자인하라.

 

 8. 그들의 전후관계를 반영하는 방법으로 데이터의 자료가 돕는다. 예를 들어,  McCandless는 국가의 군대의 크기를 설명하는 것에 장난감 군인의 크기 사용한다. 그는 또한 US 경제의 상대적인 크기를 설명하는 것에 대한 미국 대륙의 영역처럼 독일, 영국, 중국 그리고 일본의 GDP를 표시한다. 이러한 시각화는 표준    도표가 하지 못하는 방법에서 자료의 전후관계에 직접 연결한다.

 

국가, 국토, 도시, 등에 대한 자료 상황을 설명하는 것에 좋은 방법은 지도를 사용하는 것에 있다. 예와 마찬가지로, 우리는 지도에서 몇몇의 남미 국가의 per capita GDP를 표시하는 것에 Google에 의한 토지 도표 시각화 도구를 사용할                    것이다. 이 단계를 따르라:

 

 

             a)          Internet browser에서 Google Code Playground를 열어라:

             https://code.google.com/apis/ajax/playground/?type=visualization#geo_chart

 

             b)          부호화 영역 수정에서, 아래에 본문을 복사하고 붙여넣으라.

function drawVisualization() {
    var data = google.visualization.arrayToDataTable([

['Country', '2011 GDP per Capita (US $)'],
['Argentina',10941],
['Bolivia', 2421],

['Brazil',12594],

['Chile',14394],

['Columbia',7067],

['Ecuador',4569]
]);
var options = {region: '005', displaymode: 'region', heig ht: 650};
var geochart = new google.visualization.GeoChart(
document.getElementById('visualization'));
geochart.draw(data,options);

}

 

             c) 연속 부호 단추를 누르라. per capita GDP에 의해 색-부호화된 남미의 상호작용 지도는 window 출력에서 나타날 수 있다. 당신이 당신의  cursor를 국가 위에 움직일 때, 국가의 per capita GDP가 나타날 것이다.

 

 

             d)  위에 도표는 불완전하다. Peru, Paraguay, Uruguay 그리고 Venezuela per capita GDP를 포함한 것 또한 그 이상으로 부호를 수정하라. 세계   은행으로부터의 2011 per capita GDP에 대한 자료를 사용하라.

                           http://data.worldbank.org/indicator/NY.GDP.PCAP.CD.

 

             e) (임의의) 여기 지침을 읽어라:

                  https://developers.google.com/chart/interactive/docs/gallery/geochart.

                  그 다음에, 당신을 흥미롭게 하는 자료로부터 당신만의 토지도표를 만들어라!

 

더 많은 읽기와 관련 자료

 

•. David McCandless http://www.davidmccandless.com/

•. McCandless, D. (2009). The Visual Miscellaneum: A Colorful Guide to the World’s Most Consequential Trivia. New York: Harper Design.

•. Fleming, J. (Host) and McCandless, D. (Interviewee). (2011). To The Best of Our Knowledge: TMI? [Audiobook]. Wisconsin Public Radio.

•. Yau, N. (2011). Visualize This: The FlowingData Guide to Design, Visualization and Statistics. London: Wiley.

•. Few, S. (2010, March/April/May). “Our irresistible fascination with all things circular.” [critique of McCandless’s “Colours in Cultures” infographic]. Visual Business Intelligence Newsletter.

•. Few, S. (2007). Information Dashboard Design: The Effective Visual Communication of Data. California: O’Reilly Media.

•. FastCompany: Infographic of the Day http://www.fastcodesign.com/section/infographic-of-the-day

•. Interactive Things: Datavisualization.ch http://datavisualization.ch/

•. Visual.ly http://visual.ly/

•. Google Developers: Google Chart Tools https://developers.google.com/chart/interactive/docs/index

 

 

강의 자료 영문 출처 : http://www.wiley.com/WileyCDA/Section/id-814251.html

번역 : 김지희 교육조교(숙대 음악치료대학원) 번역감수: 이지선 교수(숙대 시각영상디자인학과)


관련 TED 강의 모음 링크 : http://www.ted.com/playlists/56/making_sense_of_too_much_data.html

posted by jisunlee

정보 시각화 관련 동영상 datavisualization on Vimeo.com

정보 시각화 관련 동여상을 모아놓은 채널
http://vimeo.com/channels/datavisualization

The Perfect Athlete from Duncan Elms on Vimeo.


운동과 관련된 영상에 모션이 적용된 예

영화와 디자인을 고민하시는 분들에게도 좋은 자료들...
posted by jisunlee