1. HBase 와 Pig 연동
    1. HBase table을 미리 만들어두고 있어야 함
    2. 첫번째 컬럼은 unique한 key여야 함 → userID 예제가 적절한듯
    3. USING clause를 사용해서 HBase로 테이블을 저장할 수 있음
    4. importtsv라는 툴을 쓰면 더 쉽게 할 수 있음
  2. users table을 u.data에서 가져올 예정
    1. HDFS로 데이터 업로드 → Files View → user → maria_dev → ml-100k → u.data && u.users
    2. pipe로 나누어져있는데, 고유값, 나이, 성별, 직업, 우편번호로 나뉘어짐
    3. pig로 import해서 hbase로
      1. 근데 hbase가 hdfs위에서 돌아가는데 왜 굳이 pig로 넣은다음에 hbase로 가야하는지는 좀 의문
hbase shell

list

create 'users', 'userinfo' (users == unique key(first column), userinfo == column family)

exit
wget <http://media.sundog-soft.com/hadoop/hbase.pig>

less hbase.pig

Screen Shot 2022-07-03 at 4.53.12 PM.png

pig hbase.pig
hbase shell

list 

scan 'users'

Screen Shot 2022-07-03 at 4.55.44 PM.png