SparkSQL-SparkOneHive
创始人
2025-05-29 17:53:23
0

部署

连接Hive操作 

小试牛刀:Hive版本的WordCount 

从MySQL中读取数据存储到hive中 


部署

 1、Spark 要接管 Hive 需要把 hive-site.xml 拷贝到 conf/目录下

2、把 Mysql 的驱动 copy 到 jars/目录下

3、 如果访问不到 hdfs,则需要把 core-site.xml 和 hdfs-site.xml 拷贝到 conf/目录下

     导入依赖

org.apache.sparkspark-hive_2.123.0.0

org.apache.hivehive-exec1.2.1

mysqlmysql-connector-java5.1.27

  将 hive-site.xml 文件拷贝到项目的 resources 目录中

 

        虚拟机中后台启动hive 

hiveserver2 &
nohup hive --service metastore &

连接Hive操作 

在操作hive时,需要对哪个库的表进行操作则需要写 -> 数据库名.表名 不然都会默认使用default数据库 
spark.sql("select * from ee.user")
def main(args: Array[String]): Unit = {//创建Session对象val spark = SparkSession.builder() //构建器.appName("sparkSQL") //序名称程.master("local[*]") //执行方式:本地.enableHiveSupport() //支持hive相关操作.getOrCreate() //创建对象spark.sql("select * from ee.user")spark.close()}

小试牛刀:Hive版本的WordCount 

注意: 当开启了enableHiveSupport()机制之后可能会导致在本地磁盘的文件会有突然读取不到的清空。原因是hive默认会从HDFS上面获取数据文件

想访问本地磁盘时的解决方法:需在本地磁盘路径前添加file:///

spark.read.text("file:///datas\\a.txt")
def main(args: Array[String]): Unit = {//创建Session对象val spark = SparkSession.builder() //构建器.appName("sparkSQL") //序名称程.master("local[*]") //执行方式:本地.enableHiveSupport() //支持hive相关操作.getOrCreate() //创建对象val df: DataFrame = spark.read.text("file:///D:\\spark.test\\datas\\a.txt") //载入数据df.createTempView("wc") //创建表spark.sql("""|select tmp.word,count(tmp.word) from(|select explode(split(value," ")) word from wc|)tmp|group by tmp.word|order by count desc|""".stripMargin).show()spark.close()}

从MySQL中读取数据存储到hive中 

        准备MySQL数据库user表 

        向Hive创建表时 操作hive权限问题 因为是创建到HDFS上所以要提供root用户权限

System.setProperty("HADOOP_USER_NAME","root")
def main(args: Array[String]): Unit = {//创建Session对象val spark = SparkSession.builder() //构建器.appName("sparkSQL") //序名称程.master("local[*]") //执行方式:本地.enableHiveSupport() //支持hive相关操作.getOrCreate() //创建对象//从MySQL中读取数据存储到hive中 //添加操作HDFS的用户名System.setProperty("HADOOP_USER_NAME","root")//创建info表spark.sql( //需指定数据库不然会创建到默认数据库下"""|create table ee.test(|id int,|name string,|age int|)|""".stripMargin)//jdbc读取mysqlval pro = new Properties()pro.put("user","root") //指定用户名pro.put("password","p@ssw0rd") //指定密码//jdbc("路径","表名","Properties对象")val df = spark.read.jdbc("jdbc:mysql://master:3306/spark-sql","user",pro)df.write.insertInto("ee.test")spark.sql("select * from ee.test").show()spark.close()}

相关内容

热门资讯

「露营X本溪=完美夏日」本溪露... 风从山涧来,夏夜未央 萤火是灯,星空为被 本溪的夏日 正等待一场不期而遇的露营 枫林·谷里房车露营...
我是长沙人,去了一趟湘西,不吹... “在湘西,我被陌生人‘强行’请回家吃了顿饭。”这听起来像小说情节,但却是我的真实经历。作为一个自诩“...
新疆很美但机票蛮贵!暑期旅游旺... 潮新闻客户端 记者 陈薇 一年一度的高考刚落下帷幕,毕业旅行市场迅速升温。 “6月底飞新疆机票怎么这...
“魔芋革命”引爆千亿赛道:卫龙... 本报讯 (记者李静)在河南漯河——这座以“中国食品名城”闻名的中原腹地,一座颠覆传统食品工业想象的“...
肉苁蓉与日常饮食:三款养生食谱... 肉苁蓉与日常饮食:三款养生食谱轻松调理肾气 “肾乃先天之本,养肾一寸,延寿十年。” 在浮躁忙碌的现代...
超嫩牛肉秘诀大公开!辣椒炒牛肉... 辣椒炒牛肉,这道经典的家常菜,色香味俱全,吃上一口,辣味与牛肉的鲜嫩交织在一起,令人陶醉。无论是搭配...
原创 “... 潮湿闷热的空气像一张无形的网,裹得人浑身不自在。衣服晾不干,地板湿漉漉,连呼吸都带着一股黏腻感。梅雨...
上热搜走红毯都不夸张,广东人夏... 你家乡的夏天,是什么味儿的? 泡过冰水的西瓜甜香,深夜街边小龙虾的辣味,还是晒过的被子散发出的,太阳...
宁波这家酸奶店开业首日排队60... 刚过去的这个周末,如果有朋友去过江北的万象城,那应该会看到这样一幕👇 是的,这里新开了一家“楼下酸...
去了一趟衡阳和益阳,实话实说:... “师傅,你们衡阳人是不是都这么能聊啊?”坐在高铁上,我忍不住问邻座的大哥。从长沙到衡阳短短40分钟,...
【我为群众办实事】这个“早7晚... 近日,石河子市东城街道58社区大食堂正式开业,让附近的居民在家门口吃上了可口的热乎饭。 中午1时,...
以“景”促旅:一条街穿越时空重... 封面新闻记者 曾业 罗轩恩阳河碧波荡漾,梦华录时空交错。北岸明清古码头茶香袅袅,石阶上茶客轻抿盖碗茶...
千城胜景|河北秦皇岛:夏日帆影...   近日,河北省秦皇岛市北戴河新区海天一色,洁白帆影摇曳在碧波间,拉开了海上运动的序幕。风起帆扬,破...
上海迪士尼奇妙升级:奇妙仙子首... 6月16日,上海迪士尼度假区迎来开幕九周年纪念,一场温馨的庆典仪式在故事家雕塑前举行。华特迪士尼动画...