¿ª·¢Õß¾ãÀÖ²¿

±êÌâ: Ϊʲô˵Spark SQLÔ¶Ô¶³¬Ô½ÁËMPP SQL [´òÓ¡±¾Ò³]

×÷Õß: xman    ʱ¼ä: 2016-7-8 07:07
±êÌâ: Ϊʲô˵Spark SQLÔ¶Ô¶³¬Ô½ÁËMPP SQL
¡¡¡¡

¡¡¡¡Ç°ÑÔ
¡¡¡¡ÕâÀï˵µÄ²¢²»ÊÇÐÔÄÜ£¬ÒòΪÎÒû³¢ÊԶԱȹý(ÏÂÎÄ»áÓмòµ¥µÄ˵Ã÷)£¬¶øÊdz¢ÊÔ´ÓijÖÖ¸ü¸ßÒ»²ã´ÎµÄµÄ½Ç¶ÈÈ¥¿´£¬ÎªÊ²Ã´Spark SQL ÊÇÔ¶Ô¶³¬Ô½MPP  SQLµÄ¡£
¡¡¡¡Spark SQL ºÍ MPP SQL Æäʵ²»ÔÚÒ»¸öά¶ÈÉÏ¡£¼ò¶øÑÔÖ®£¬
MPP SQL ÊÇ Spark SQL µÄÒ»¸ö×Ó¼¯
¡¡¡¡Spark SQL ³ÉΪÁËÒ»ÖÖ¿çÔ½ÁìÓòµÄ½»»¥ÐÎ̬
¡¡¡¡MPP SQL ÊÇ Spark SQL µÄÒ»¸ö×Ó¼¯
¡¡¡¡MPP SQL Òª½â¾öµÄ¼¼ÊõÎÊÌâÊǺ£Á¿Êý¾ÝµÄ²éѯÎÊÌâ¡£ÕâÀï¸ù¾Ýʵ¼Ê³¡¾°£¬Ä㻹¿ÉÒÔ¼ÓÉÏһЩÐÞÊδʻ㣬ƩÈçÃ뼶£¬Ad-hoc Ö®Àà¡£
¡¡¡¡ÔÚʵ¼ÊÒµÎñÖÐ
¡¡¡¡Ì½Ë÷ÀàÒµÎñ£¬±ÈÈçKPI¶àά·ÖÎö£¬Óû§»­Ïñ²éѯ£¬Êý¾Ý¿Æѧ¼ÒÃþµ×Êý¾ÝµÈ
¡¡¡¡ÔËÓªÀàÒµÎñ£¬±ÈÈ籨±í(ÏÖÔںܶàBIϵͳ»ù±¾ÉÏÍêÈ«»ùÓÚSQLÀ´¹¹½¨)£¬¸÷ÖÖÔËÓªÁÙʱͳ¼ÆÐèÇó
¡¡¡¡·ÖÎöÀàÒµÎñ£¬²»¹ýÕâ¸ö»á±È½ÏdzÏÔ¡£ÏÔÈ»£¬ÕæʵµÄµÄ·ÖÎöÓ¦¸ÃÖ÷ÒªÒÀÍÐһЩͳ¼ÆÀ࣬»úÆ÷ѧϰµÈ¼¼ÊõµÄÖ§³Ö
¡¡¡¡ÔËάÀàÒµÎñ£¬±ÈÈçʵʱ²éѯ²é¿´º£Á¿µÄϵͳÈÕÖ¾µÈ
¡¡¡¡MPP SQL ÊÇÓÐÒ»¶¨µÄÐÔÄÜÓÅÊƵģ¬´ÓHAWQ£¬Impala µÈ¶¼ÊÇ»ùÓÚMPP¼Ü¹¹µÄ¡£È»¶ø½öÏÞÓÚ´Ë¡£ÕâЩ¹¦ÄÜSpark SQL Ä¿Ç°¶¼ÒѾ­º­¸ÇÁË£¬MPP  SQLÄÜ×öµÄÊÂÇ飬Spark SQL¶¼Íê³ÉµÄºÜƯÁÁ¡£
¡¡¡¡ÒÀÍÐÓÚSpark ×ÔÉíµÄȫƽ̨ÐÔ(ƯÁÁµÄDataSource APIÒÔ¼°¸÷¸ö³§É̵ÄŬÁ¦ÊÊÅä)£¬Spark SQL  »ù±¾ÉÏ¿ÉÒÔ¶Ô½ÓÈÎÒâ¶à¸öÒì¹¹Êý¾ÝÔ´½øÐзÖÎöºÍ²éѯ¡£
¡¡¡¡¹ØÓÚÐÔÄÜ¿ÉÒÔÔÙ¶à˵Á½¾ä£º
¡¡¡¡µÃÒæÓÚһЩ¾ßÓи´ÔÓ´æ´¢¸ñʽµÄÎļþµÄµ®Éú£¬Æ©ÈçCarbonData£¬ Spark SQL ÒѾ­ÊµÏÖº£Á¿Êý¾ÝµÄÃ뼶²éѯ
¡¡¡¡Spark  ×ÔÉíͨ¹ýTungstenµÈÏîÄ¿µÄÓÅ»¯(ÓÈÆäÊÇ´úÂë×Ô¶¯Éú³É)£¬ËÙ¶ÈÔ½À´Ô½ÉúÃÍ£¬¶øJVMÆ©ÈçGC´øÀ´µÄÎÊÌâÔò¿ÉÒÔ½øÒ»²½Í¨¹ýoff-heapµÄ·½Ê½¼õÉÙ¡£
¡¡¡¡ËùÒÔ Spark SQL ºÍ MPP SQLÔÚÐÔÄÜÉϵIJî¾àÒ²»áÔ½À´Ô½Ð¡¡£
¡¡¡¡Spark SQL ³ÉΪÁËÒ»ÖÖ¿çÔ½ÁìÓòµÄ½»»¥ÐÎ̬
¡¡¡¡Spark ͨ¹ýʹÓÃDS(2.0ͳһÁËDF ºÍ  DS£¬Ê¹ÓÃÒ»Ì×SQLÒýÇæ)¼«´óµÄÔöÇ¿Á˽»»¥ÓïÒ⣬Òâζ×ÅÄã¿ÉÒÔÓÃSQL(DS)×÷ΪͳһµÄ½»»¥ÓïÑÔÍê³ÉÁ÷ʽ£¬Åú´¦Àí£¬½»»¥Ê½²éѯ£¬»úÆ÷ѧϰµÈ´óÊý¾ÝÁìÓò³£¼û³¡¾°¡£ÕâÔÚÈκÎÒ»¸öϵͳ¶¼ÊDz»¶à¼ûµÄ£¬Ò²¿É¼ûSparkÍŶӵijéÏóÄÜÁ¦¡£
¡¡¡¡ÒýÑÔÖеÄÄÇƪÎÄÕÂÆäʵÊÇ×÷ÕßͲÛSpark ÍŶӶÔSpark core(RDD)ÄDzã¹Øע̫ÉÙÁË£¬ËùÒÔ¿ªÊ¼·¢ÀÎɧ¡£
¡¡¡¡ÏÖÔÚÎÒÃÇÔٻعýÍ·À´¿´ÎÒÃdz£¼ûµÄһЩҵÎñ£º
ʵʱ·ÖÎöÀàÒµÎñ
¡¡¡¡Ì½Ë÷ÀàÒµÎñ
¡¡¡¡·ÖÎöÔ¤²âÀàÒµÎñ
¡¡¡¡ÔËÓª±¨±íÀàÒµÎñ
¡¡¡¡Ê×ÏÈÕâЩҵÎñ¶¼¿ÉÒÔʹÓÃSpark À´ÊµÏÖ¡£Æä´ÎͳһµÄ½»»¥½Ó¿Ú¶¼ÊÇDS(DF/SQL)£¬²¢ÇÒDS/SQL ÊÇÒ»Ì×¼«¶ÈÒ×Óò¢Çҹ㷺ÆÕ¼°ºÍ½ÓÊܵġ£
¡¡¡¡µ±È»Spark Ò²²»ÊÇÒ»²½¾Í×öµ½ÕâµãµÄ£¬Ô­À´Á÷ʽ¼ÆËãºÍÅúÁ¿¼ÆËã¾ÍÊÇÁ½Ì×API£¬ DF ºÍ DS Ò²ÊÇÁ½Ì×API£¬ºóÃæ¾­¹ý·¢Õ¹£¬Databricks  ÍŶÓÒ²ÔÚ»ý¼«Ë¼¿¼ºÍÂýÂý³É³¤£¬¾­¹ýÏÈÇ°ÒѾ­ÓеĻýÀÛ£¬²Å×öµ½ÏÖÔÚµÄÕâÒ»²½¡£
¡¡¡¡ËùÒÔ±¾ÖÊÉÏDS/SQL ÒѾ­³ÉΪ³ýÁËRDD API  ÒÔÍ⣬ÁíÍâÒ»Ì×ͨÓõģ¬Í³Ò»µÄ½»»¥Ê½API£¬º­¸ÇÁËÁ÷ʽ£¬Åú´¦Àí£¬½»»¥Ê½²éѯ£¬»úÆ÷ѧϰµÈ´óÊý¾ÝÁìÓò¡£ÕâÒ²ÊÇÎÒÃǵÚÒ»´Î´ï³ÉÕâÑùµÄͳһ£¬Ä¿Ç°À´¿´Ò²½öÔÚSparkƽ̨ÉϵÃÒÔʵÏÖ£¬ËüÊǵĴóÊý¾ÝµÄʹÓúÍѧϰÃż÷½øÒ»²½½µµÍ£¬¹¦ÔÚǧÇï¡£
¡¡¡¡RDD VS DS/SQL
¡¡¡¡DS/SQL ÊÇÒ»Ì×Êý¾ÝÀàÐÍÊ×ÏÈ£¬²Ù×÷ÖÖÀàÊÜÏ޵ıí´ïÓïÑÔ£¬Òâζ×ÅSpark  ÍŶӿÉÒÔ×ö¸üºÃµÄÐÔÄÜÓÅ»¯£¬Ò²Òâζ×ÅÃż÷¸üµÍ£¬ÔÚÒ×ÓÃÐÔºÍÐÔÄÜÉ϶¼ÄÜÈ¡µÃÁ¼ºÃµÄƽºâ¡£







»¶Ó­¹âÁÙ ¿ª·¢Õß¾ãÀÖ²¿ (http://xodn.com/) Powered by Discuz! X3.2