什么是PIG
是一種設(shè)計(jì)語(yǔ)言,通過(guò)設(shè)計(jì)數(shù)據(jù)怎么流動(dòng),然后由相應(yīng)的引擎將此變成MAPREDUCE JOB去HADOOP中運(yùn)行。
PIG與SQL
兩者有相同之處,執(zhí)行一個(gè)或多個(gè)語(yǔ)句,然后出來(lái)一些結(jié)果。
但不同的是,SQL要先把數(shù)據(jù)導(dǎo)到表中才能執(zhí)行,SQL不關(guān)心中間如何做,即發(fā)一個(gè)SQL語(yǔ)句過(guò)去,就有結(jié)果出來(lái)。
PIG,無(wú)須導(dǎo)數(shù)據(jù)到表中,但要設(shè)計(jì)直到出結(jié)果的中間過(guò)程,步驟如何等等。