77百科网
当前位置: 首页 生活百科

excel写sql(从Excel到SQL效率增倍错误减半)

时间:2023-08-10 作者: 小编 阅读量: 2 栏目名: 生活百科

Excel的灵活性使得在大型数据集中几乎不可能实现一致性和准确性。不过完成这项工作通常有更好的工具。SQL数据库可以处理大量数据而无需担心性能问题,并且具有保护数据完整性的有序结构。不能动态更改单元格的原因是数据库具有严格的结构。作为独立的单元,每行中的所有值绑定在一起。SELECT指定所需数据的列,FROM指示该数据列属于哪个表。不过这对于IF语句将是一场噩梦。一种选择是在SQL中操作数据、导出数据并在Excel中构建图表。

如果你经常用到Excel,下面这个令人沮丧的对话框可能对你来说并不陌生。

也可能遇到过这种情况:编辑电子表格时运转非常缓慢,每点击一次鼠标电脑就会卡10秒。

出现这种情况通常是由于文件太大或工作簿中的公式过多。Excel最多可以处理100万行数据,但当你处理大型数据集或进行繁重的分析时,例如,将公式应用于一组单元格、链接多个电子表格或连接到其他工作簿时,在未超出Excel处理的最大行数之前,其操作速度会大大降低。

Excel还有一个可能导致其效率低下的弱点: 结构过于灵活。这听起来有点匪夷所思——灵活性是人们钟爱Excel的原因之一。因为每个单元格都是一个独立的实体,所以可以自由地添加脚注、合并单元格或绘制“刺绣图案”。

但是,如果一个单元格的操作很简单,那么就很难信任整个电子表格的完整性。Excel的灵活性使得在大型数据集中几乎不可能实现一致性和准确性。不管你有多警惕,不管你在电子表格中梳理了多少次拼写错误和错误的公式,你可能仍会有所遗漏。

不过完成这项工作通常有更好的工具。有些小窍门可以帮助你利用Excel知识来学习SQL。

嗨,SQL

在Excel中使用的数据肯定来源于某处。而这个来源就是数据库。即使你感觉数据的来源缺乏技术性(比如Google Analytics、Stripe或Salesforce),但你查询的就是数据库。

我们的网站1月份的访问量是多少? 我们刚刚推出的产品的支付渠道放弃率是多少?哪些销售代表拥有更多的销售渠道?这些都是人类的疑问,而不是计算机语言。作为一个Excel的高级用户,如果拥有正确的数据集,你可能会考虑如何将这些问题写成公式。

那么,如何直接查询数据库呢?在大多数情况下,人们使用SQL( Structured Query Language 结构化查询语言)。SQL会告诉数据库要对哪些数据进行查看和运算操作。

将一些初始运算导入SQL中,可以减少导出的数据量。若使用的数据集较小,那么你可能不会遇到Excel的性能问题。

随着你对SQL的操作熟练度的提高,你可以将越来越多的分析转移到SQL中,直到Excel成为例外,而不是规则。SQL数据库可以处理大量数据而无需担心性能问题,并且具有保护数据完整性的有序结构。

学习一门新语言可能听起来令人望而生畏,就像使用感觉技术性更高的工具一样。但是作为一个Excel用户,你对SQL的了解已经超出自己的预期。

电子表格,满足关系数据

数据库是一个有序数据集合。数据库有很多不同的类型,但是有一种数据库可以与SQL建立连接,即关系数据库(relation database)。

正如Excel工作簿由电子表格组成一样,关系数据库也由表组成,如下所示。

与电子表格一样,表也有行和列。但是在表中,单元格(或数据库术语中的“值”)之间不能建立联系。若想将Ralph Abernathy的家乡从上图所示表格的第一行中排除,你不能直接将其删除,而必须排除整个行或者整个“家乡”列。

不能动态更改单元格的原因是数据库具有严格的结构。作为独立的单元,每行中的所有值绑定在一起。每个列必须有唯一的名称,并且只能包含特定类型的数据(“Integer”、“Text”、“Date”等)。

Excel的灵活结构现在听起来不错,但请稍等。因为数据库的结构非常严格,所以保护数据的完整性较容易。换句话说,你所得结果中出现不一致和错误的可能性要小得多。这意味着你的数据的可信度更高。

从公式转为查询

在Excel中操作数据最常用的方法是使用公式。公式由一个或多个函数组成,这些函数告诉Excel如何处理单元格中的数据。例如,你可以使用SUM(A1:A5)进行数值求和,或者使用AVERAGE(A1:A5).求其平均值。

公式所对应的SQL语句是查询。返回上表的查询,如下所示

SELECT player_name,

hometown,

state,

weight

FROM benn.college_football_players

SELECT 和 FROM 是任何SQL查询的两个基本组成部分。SELECT 指定所需数据的列, FROM指示该数据列属于哪个表。你可以通过在SELECT 后添加星号(*)来表示所有的列,如下所示。

SELECT *

FROM benn.college_football_players

该查询将会显示 benn.college_football_players 表中的所有列,这样你就可以对整个数据集有所了解。一旦知道需要什么,你就可以快速地删除列以减小数据集规模。

与公式一样,查询由指定数据操作的函数组成。查询还可以包含子句、运算符、表达式和其他一些组件,但是我们不打算在这里细讲。你需要知道的是,你可以使用SQL操作数据,且操作方式与excel的几乎完全一样。

以 IF 函数为例。使用 IF 创建条件语句,根据定义的规则过滤数据或添加新数据。当你把一个 IF 函数应用到一个单元格上时,所得结果如下:

=IF(logical_test, value_if_true, [value_if_false])

也可表示为IF <some condition is met> THEN <display this value> OTHERWISE <display a different value>. 其中,OTHERWISE部分(显示为)是可选的。相当于 IF 的SQL语句是 CASE 。两者的语法非常相似。

CASE WHEN <condition 1 is met> THEN <display value 1>

ELSE <display a different value>

END

CASE语句比IF 语句更容易阅读,因为SQL查询有多行,是具有多个条件的IF 语句的理想化的结构。例如,若想在基于Excel中的现有数据中添加两个类别,则必须将一个IF语句嵌入另一个IF语句中。当添加的条件很多时,事情很快就会变得很糟糕。但是在SQL中,你可以添加一个新条件作为另一行。

在SQL中,让我们用上面的大学足球队的数据来添加多个条件。我们要添加一列,把足球运动员分成四组。其查询如下:

SELECT player_name,

weight,

CASE WHEN weight > 250 THEN 'over 250'

WHEN weight > 200 THEN '201-250'

WHEN weight > 175 THEN '176-200'

ELSE '175 or under' END AS weight_group

FROM benn.college_football_players

所得表格如下:

也没有很难,对不对?不过这对于IF语句将是一场噩梦。

你可能会想,那么图表呢?哪些让我的报告称得上是报告的图形呢? 一种选择是在SQL中操作数据、导出数据并在Excel中构建图表。

但是,如果你想跳过导出步骤,一些SQL程序(比如Mode)允许你在查询结果之上构建图表。这些图表是直接绑定到数据库的,因此每当重新运行查询时,结果和可视化都会自动刷新。

学习SQL的下一步

当你对SQL有所了解时,知道什么是学习重点以及如何处理公司的数据是很有帮助的。

选择针对数据分析的教程

SQL的资源有很多,但不是所有的SQL资源都专注于数据分析。

工程师和数据库管理员使用SQL在数据库中创建、更新和删除表。他们可以上传一个全新的表,也可以从数据库中永久删除一个表。这些任务与你将如何使用SQL有很大的不同(至少在你对数据感兴趣并因此转为从事数据分析工作之前)。

不要陷入针对数据库管理的SQL教程中。专注于查询相关的教程。下面是一些SQL教程:

· 数据检索

· 数据过滤及一些简单的运算

· 同时使用多个过滤器

· 对结果进行排序

· 数据聚合

· 计算列中的唯一值

· 条件逻辑

· 数据集连接

如果你发现自己在教程中讨论以下内容:

· CREATE TABLE

· DROP TABLE

· CREATE DATABASE

· DROP DATABASE

那你的关注点已经出错了。

利用公司的数据进行练习

如果你办公时需要进行数据分析,那么没有什么比利用公司的数据学习SQL更合适了。你可以探索公司的数据结构,同时学习技术概念。你的任何选择都将立即适用于你的工作。

要做到这一点,你需要了解公司的数据是如何构成的:产品和营销数据存储在哪里? 如果你想查看上个月出现问题的帐户,应该查询哪个表?

大多数企业都有一个分析团队,每天处理公司的数据。这些人将能够回答你的问题或为你指出有用的文档。这里有一种互惠关系: 如果你自己查询数据,分析团队积压的数据请求就会减少。

    推荐阅读
  • 戴尔售后苏州(戴尔杭州旗舰店及售后维修在哪里)

    杭州戴尔DELL电脑官方实体旗舰店(总店)及售后维修;位于杭州市上城区新业路228号来福士商场5楼22号。戴尔笔记本、台式机、一体机、工作站、戴尔周边配件等。这是一家以官方门店为主题的店铺,这里的服务与产品还是值得我们信任;同价、同产品、切服务较好,更加的放心!

  • 多肉怎么养多长时间浇一次水(养多肉几天浇一次水)

    养多肉几天浇一次水?很多花友都说自己养护的多肉容易黑腐烂根,这主要就是因为浇水不当。其实给多肉植物浇水并没有唯一的标准,不同的品种,环境不一样,季节不同,盆土不同,那浇水都是不一样的。多肉是比较耐旱的,肥厚的叶片可以自己储存很多水分。多肉植物在春秋是生长期,这个时候生长快,蒸发也快,可以适当的多浇水,一般盆土干了七八分就浇水,但如果连续阴雨天或者空气湿度比较大,就需要减少浇水次数。

  • 广汽ix4的续航里程为多少 广汽ia5续航里程

    根据广汽丰田的官方介绍,广汽ix4的续航里程为270km,属于同级别纯电动紧凑型suv续航里程的中游水平。但是根据部分广汽ix4车主的实测数据来看,其真实续航里程一般在240km左右,不同车主的测试结果可能会有所偏差,以上只起参考作用。对于一款纯电动汽车来说,我们在使用时尽量不要远离市区,防止因为没有充电桩充电而产生不必要的麻烦。与燃油汽车相比,纯电动汽车不会排放污染物,所以更加的节能环保。

  • omg小狮子说只服211(原来狮子王中的丁满是TA......)

    答案是否定的,猫鼬毕竟是野生动物,野性难除,随时可能会咬伤人哦!迁徙新知“野生动物大迁徙”正在上演!如果你恰好知道答案,可以点击上方“写回答”,与频频在线互动哦~或者前往“央视频”官方微博,搜索“迁徙新知”,在问题下方说出你的答案,还有机会获得精美礼品!谜底将于明日中午12:00在“央视频”官方微博揭晓~想近距离感受非洲草原上的壮观景象吗?

  • 奶酪有什么危害吗(奶酪是否对我们的健康有害)

    对于特定的心脏健康风险,到底是吃全脂还是减脂奶酪的问题尚未得到充分解决。钙有助于降低骨质疏松症的风险,蛋白质是人体组织合成和修复所必需的物质。奶酪也是一种发酵食品,含有细菌或酵母,有助于构建健康的肠道微生物群落。如果您正在减轻体重或患有心脏病,请咨询医生是否可以食用奶酪。到目前为止,没有研究显示奶酪与心脏病有关。虽然奶酪含有饱和脂肪,但我们目前还不确定它是否会造成动脉堵塞。

  • 来碗羊汤御寒(小雪驱寒第一方)

    今天是小雪,又赶上一波强烈寒潮来袭。现在想来,这种鲜恐怕来自简阳羊肉汤特殊的羊种。简阳羊肉汤用的是“简阳大耳朵羊”,据说是简阳当地的土山羊和美国引进的努比羊杂交而成的后代。两种羊优势结合,让大耳朵羊成了简阳羊肉汤不可替代的主要原料。单县羊汤大概也是山东最有名的羊汤,被誉为“天下第一汤”。所以单县羊汤不仅味道鲜美,还有很好的温补效果。内蒙古—海拉尔羊肉汤最后这碗羊汤,就在今年。

  • 言字旁一个音(言字旁一个音是什么字)

    下面内容希望能帮助到你,我们来一起看看吧!言字旁一个音言字旁加个音字是谙,读音是ān。谙是一个汉语汉字,读音为ān,形声。白居易《忆江南》等均有相关记载。——《后汉书·虞延传》

  • 国产手机有几款最新(外媒评年度十佳手机)

    随着2021年各大厂商的秋季发布会陆续召开,各大手机品牌已交出了自己的答卷。摄像方面,一加9Pro所搭载的主摄传感器采用的是一加与索尼联合定制的IMX789传感器,支持OIS光学防抖。超级主摄单元包含有5000万像素OIS主摄4000万像素黑白镜头1300万像素超广角镜头,超级变焦单元则由6400万像素潜望式长焦镜头和激光对焦传感器组成。与此同时,屏占比为92.7%,在大屏幕手机中可以说OPPOFindX3Pro的屏幕尺寸与显示质量方面均表现出了不错的水准。

  • 6万左右七座车推荐(这几款新车和二手车都不错)

    而六座车型更是深受好评,第三排能否用上不说,至少第二排让家人坐着很舒服。第三款:别克GL6车是好车,但是风光都被别克GL8抢走了。价格上别克一贯是合资车里面追求性价比的,在别克GL6这同样如此。一流的技术、超高的配置再加上不错的价格,实际上别克GL6如果没有大哥抢镜,可能如今也是堪比比亚迪宋max的存在吧。总体来说,这三款车如果你追求性能就就选择杰德,追求性价比就选择比亚迪宋max,如果你追求生活就选择别克GL6。

  • 高考文言文必背100句(高考语文中的100个最易错文言文实词及文句翻译)

    20.太祖知其心,许而不夺。误:夺取,正:强行改变。