当前位置: 首页 > news >正文

【SQL基础】【leetcode】SQL50题

查询

(1)可回收且低脂的产品

题目链接

SELECT product_id
FROM Products
WHERE low_fats='Y' AND recyclable='Y';

很简单,最基础的sql语句。

(2)寻找用户推荐人

题目链接

SELECT name
FROM Customer
WHERE referee_id != 2 OR referee_id is NULL

SQL中对于空值的处理是is NULL 或者 is NOT NULL,对于布尔逻辑来说,null值不是true也不是false,因此null值和任何值比较结果都是UNKNOWN。为了解决这种unknown的情况,SQL使用了is NULL和is NOT NULL。

(3)大的国家

题目链接

SELECT name,population,area
FROM World 
WHERE population>=25000000 OR area>=3000000

即对OR的使用,可以把两个条件放在一起。

(4) 文章浏览1

题目描述

SELECT distinct(author_id) as id
FROM Views
WHERE author_id=viewer_id
ORDER BY id

因为可能出现不止浏览一次的情况,因此要使用distinct进行去重,同时注意返回顺序。(逆序为DESC为逆序)

(5)无效的推文

题目描述

SELECT tweet_id
FROM tweets
WHERE LENGTH(content) > 15

使用LENGTH函数即可解决。在 MySQL 中,LENGTH 返回字符串的字节长度,而不是字符数量。因此对于多字节字符集时,如 UTF-8,用LENGTH去处理占用多个字节的字符(例如中文),就会出现问题。因为一个中文字符占3字节。所以你可以使用CHAR_LENGTH来处理

连接

(1)使用唯一标识码替换员工ID

题目描述

SELECT unique_id, name
FROM Employees
LEFT JOIN EmployeeUNI
USING(id)

就是基础的左连接,如果有疑问可以看介绍。

左连接就是Employees根据id的进行链接EmployeeUNI,也就是一一对应。如果出现EmployeeUNI里没有能对应Employees的内容,那就只显示Employees里的内容。

(2)产品销售分析 I

题目描述

SELECT product_name, year, price
FROM Sales s, Product p
WHERE s.product_id=p.product_id

不需要特殊的连接方式,直接用inner join就可以。或者我写的这种隐式链接。
这一题的本质就是将两个表合并,得到所需的信息,因此不需要额外的操作了。

(3)进店却未进行过交易的顾客

题目描述

有两种做法。

# Write your MySQL query statement belowSELECT customer_id, COUNT(v.visit_id) as count_no_trans
FROM Visits v
WHERE v.visit_id NOT IN (SELECT visit_idFROM Transactions)
GROUP BY customer_id
ORDER BY count_no_trans

首先是子查询,用子查询查出Transaction的全部visit_id,然后主查询的部分查找visit_id不在Transaction里的,就可以得到只光顾商店的客人。然后对于计算次数,可以用count聚合函数进行计算,但需要用group by进行分组,这是因为如果不这样使用,聚合函数返回的结果是一个值,需要用分组进行分开。这样的问题在这里也出现过。

第二种做法是只使用联表查询:

select customer_id, count(customer_id) as count_no_trans
from visits
left join transactions using(visit_id)
where transaction_id is null
group by customer_id;

这里用LEFT JOIN后,得到了每个用户的transaction次数,但有些用户是没有交易(买东西)的,因此在where的地方要判断transaction_id是否为空,筛选出的结果就是未光顾的。

注意,联表查询得到的结果是一张临时表,而最基础的join(inner)则是不会出现NULL,对于本题是只保留1、2、5的用户,而LEFT JOIN则可以保留多的一方的数据,得出NULL值。

(4)上升的温度

题目描述

SELECT w2.id
FROM Weather w1, Weather w2
WHERE datediff(w2.recordDate, w1.recordDate)=1 AND w2.Temperature > w1.Temperature

DATE_DIFF 是一个用于计算两个日期之间差异的函数,它返回两个日期之间的差异,以天数为单位。
本题就是后一天温度大于前一天即可,因此我们返回的应该是w2的内容。

顺便一提,这样没有确定联表条件(例如w1.id=w2.id)的情况查询出的内容是笛卡儿积,而WHERE的限制条件则是对其的筛选。得到的结果一定是温度上w2>w1但日期只差一天。因此如果SELECT的是w1id,则会出现相反的结果。

(5)每台机器的进程平均运行时间

题目链接

SELECT s.machine_id, ROUND(AVG(e.timestamp-s.timestamp), 3) as processing_time
FROM (SELECT machine_id, process_id, timestampFROM ActivityWHERE activity_type='start') as s,(SELECT machine_id, process_id, timestampFROM ActivityWHERE activity_type='end') as e
WHERE s.machine_id=e.machine_id AND s.process_id=e.process_id
GROUP BY machine_id

可以把原始的表分为start表和end表,再进行联表查询,这样就可以计算时间戳的插值,进而使用AVG计算平均值,用ROUND保留三位小数。

(6)员工奖金

题目描述

SELECT name, bonus
FROM Employee
LEFT JOIN Bonus USING(empId)
WHERE bonus<1000 OR bonus IS NULL

如果要搜出NULL值,使用左连接,同时注意NULL值需要单独判断。

(7) 学生们参加各科测试的次数

题目链接

SELECT s.student_id, s.student_name, sub.subject_name,COUNT(e.subject_name) as attended_exams
FROM Students s
JOIN Subjects sub
LEFT JOIN Examinations e
ON e.student_id=s.student_id AND e.subject_name=sub.subject_name
GROUP BY student_id, subject_name
ORDER BY student_id

这个题最大的难点就是确保每个学生都有三个科目,即便他们没参加考试。但对于题目观察一下就可以知道,可以直接对学生表和科目表进行笛卡儿积的操作,这样就可以确保每个学生都有三个科目,再将结果进行左连接,即可确保结果是每个学生且都有三个科目。

(8)至少有5名直接下属的经理

题目链接

SELECT name
FROM (SELECT COUNT(managerId) as num,managerIdFROM EmployeeGROUP BY managerIdHAVING num>=5) as t, Employee e
WHERE e.id=t.managerId

Employee中搜索出managerID数量大于5的managerID,同时由managerID分组。再和Employee进行联表查询即可。

(9)确认率

题目描述

SELECT t1.user_id, IFNULL(ROUND((t2.num/t1.num), 2), 0) as confirmation_rate
FROM(SELECT user_id, COALESCE(t.num, 0) as numFROM(SELECT COUNT(user_id) as num,user_idFROM ConfirmationsGROUP BY user_id) as tRIGHT JOIN Signups USING(user_id)) as t1,(SELECT user_id, COALESCE(t.num, 0) as numFROM(SELECT COUNT(user_id) as num,user_idFROM ConfirmationsRIGHT JOIN Signups USING(user_id)WHERE action='confirmed'GROUP BY user_id) as tRIGHT JOIN Signups USING(user_id)) as t2
WHERE t1.user_id=t2.user_id
GROUP BY t2.user_id

重点之一是用IFNULL函数进行去NULL.
用两个子查询查出总数和timeout,进行除法计算。

聚合函数

(1)有趣的电影

题目描述

SELECT *
FROM cinema
WHERE (id%2!=0) AND description!='boring'
ORDER BY rating DESC

很简单 注意降序排列即可。

(2)平均售价

题目描述

SELECT p.product_id, IFNULL(ROUND(COALESCE(SUM(p.price * u.units), 0) / IFNULL(SUM(u.units), 0), 2), 0) AS average_price
FROM Prices p
LEFT JOIN UnitsSold u ON p.product_id = u.product_id AND u.purchase_date BETWEEN p.start_date AND p.end_date
GROUP BY p.product_id;

联表查询将两个表组合成一个,用时间约束价格对应的数量,然后就是如何把每列的价格和数量相乘,再将每种产品的值加和除以总数量。

对于剩下的操作,就是使用聚合函数进行计算。IFNULL可以处理null值。

(3)项目员工

题目链接

SELECT project_id, ROUND((SUM(experience_years)/COUNT(e.employee_id)), 2) as average_years
FROM Project p, Employee e
WHERE p.employee_id=e.employee_id
GROUP BY project_id

思路和上一题类似,联表后计算数值,用GROUP BY来进行分组。一般设计聚合函数都要分组。

(4)各赛事的用户注册率

题目描述

SELECT contest_id,ROUND((COUNT(user_id)/(select count(user_id) from users)), 4)*100 as percentage
FROM Register
GROUP BY contest_id
ORDER BY percentage DESC, contest_id ASC;

可以不用联表查询,因为分母实际上就是一个常数,即用户的数量。 因此直接对另一个表分组再计算每一组的个数即可。

(5)查询结果的质量和占比

题目链接

SELECT query_name,ROUND((SUM(rating/position)/COUNT(rating)), 2) as quality, ROUND(SUM(IF(rating<3, 1, 0))/COUNT(rating), 4)*100 as poor_query_percentage 
FROM Queries
WHERE query_name IS NOT NULL
GROUP BY query_name

这题的聚合函数稍微复杂一点,quality比较简单,而poor_query_percentage需要用上if来判断是否小于3。

(6) 每月交易1

题目链接

# Write your MySQL query statement below
SELECT month, country, (COUNT(id)) as trans_count, (SUM(IF(state="approved", 1, 0))) as approved_count, (SUM(amount)) as trans_total_amount, (SUM(IF(state="approved", amount, 0))) as approved_total_amount
FROM (SELECT id, country, state, amount, DATE_FORMAT(trans_date, '%Y-%m') AS monthFROM Transactions) tmp
GROUP BY country,  month

和上面一样,重点在于SUMIF函数的使用。

(7) 即时食物配送 II

题目描述

select round (sum(order_date = customer_pref_delivery_date) * 100 /count(*),2
) as immediate_percentage
from Delivery
where (customer_id, order_date) in (select customer_id, min(order_date)from deliverygroup by customer_id
)

注意,如果在子查询里得到customer_pref_delivery_date,会出现数据对不上的情况。因为min(order_date)选出的内容不一定对应customer_pref_delivery_date, 因此得到的答案未必正确。

(8) 游戏玩法分析 IV

题目链接

SELECT ROUND(COUNT(t1.player_id)/(SELECT COUNT(distinct(player_id)) FROM Activity ), 2) as fraction
FROM (SELECT player_id, MIN(event_date) as dateFROM ActivityGROUP BY player_id) t1,Activity t2
WHERE t1.player_id=t2.player_id AND datediff(t2.event_date, t1.date)=1 

分母用子查询得到常数即可。

排序和分组

(1) 每位教师所教授的科目种类的数量

题目链接

SELECT teacher_id, COUNT(distinct(subject_id)) as cnt
FROM Teacher
GROUP BY teacher_id

distinct关键字和COUNT函数计算出每个教师包含了多少个不同的科目,即可得到答案。

(2) 查询近30天活跃用户数

题目链接

SELECT activity_date as day, COUNT(distinct(user_id)) as active_users
FROM Activity
WHERE datediff('2019-07-27', activity_date) BETWEEN 0 AND 29
GROUP BY activity_date

注意日期表达需要加上单引号。如果不用BETWEEN AND的写法,也可以只用一个AND,多用一个datediff即可。

(3)销售分析III

题目链接

SELECT distinct(s.product_id), product_name
FROM Sales s LEFT JOIN Product p USING(product_id)
GROUP BY product_id
HAVING count(sale_date BETWEEN '2019-01-01' AND '2019-03-31' or null) = COUNT(*)

分好组后用having进行筛选,如果春季内的数量等于全部的数量则可以保留。

(4)超过 5 名学生的课

题目描述

SELECT class
FROM Courses
GROUP BY class
HAVING COUNT(DISTINCT(student))>=5

先分组再进行筛选,否则WHERE是早于分组的,会先筛选再分组,这对聚合函数来说会出错。

(5)求关注者的数量

添加链接描述

SELECT user_id, COUNT(follower_id) as followers_count
FROM Followers
GROUP BY user_id
ORDER BY user_id

很简单

(6)只出现一次的最大数字

题目描述

SELECT MAX(num) as num
FROM (SELECT numFROM MYNumbersGROUP BY numHAVING COUNT(num)=1ORDER BY num DESC) t

也很简单,虽然效率不高。

(7)买下所有产品的客户

题目链接

SELECT customer_id 
FROM Customer c,Product p
GROUP BY customer_id
HAVING COUNT(distinct(c.product_key))=COUNT(distinct(p.product_key))

很简单,在HAVING里进行筛选即可。

高级查询和连接

(1)每位经理的下属员工数量

题目链接

SELECT employee_id, name, reports_count, average_age
FROM Employees e, (SELECT reports_to, ROUND(AVG(age), 0) as average_age, COUNT(employee_id) as reports_countFROM Employees GROUP BY reports_to) as t  
WHERE e.employee_id=t.reports_to
ORDER BY employee_id

在子查询中可以很简单的得到平均年龄和人数,以及汇报的对象。再用Employees表与子表进行联表查询则可以得到领导的信息。

(2)员工的直属部门

题目链接

SELECT employee_id, department_id
FROM Employee e
WHERE primary_flag='Y'
GROUP BY employee_id
UNION
SELECT employee_id, department_id
FROM Employee
GROUP BY employee_id
HAVING COUNT(department_id)=1

直接查询两个结果进行UNION即可,因为两个结果集合的交集为空,而并集就是最终的结果。

(3)判断三角形

题目链接

SELECT x, y, z, IF((x+y)>z AND (x+z)>y AND (y+z)>x, 'Yes', 'No') as triangle
FROM Triangle

非常简单,只需要在SELECT里进行筛选即可。

(4) 连续出现的数字

题目链接

SELECT DISTINCTl1.Num AS ConsecutiveNums
FROMLogs l1,Logs l2,Logs l3
WHEREl1.Id = l2.Id - 1AND l2.Id = l3.Id - 1AND l1.Num = l2.NumAND l2.Num = l3.Num
;

很无聊的题,没什么实际意义。

(5)指定日期的产品价格

题目链接

SELECT t1.product_id, t2.new_price as price
FROM     (SELECT product_id, MAX(change_date) as change_dateFROM ProductsGROUP BY product_id) as t1,Products t2
WHERE t1.product_id=t2.product_id AND t1.change_date=t2.change_date

审题要注意,题目要求是在2019-08-16以及之前的…
正确答案如下:

select p1.product_id, ifnull(p2.new_price, 10) as price
from (select distinct product_idfrom products
) as p1 -- 所有的产品
left join (select product_id, new_price from productswhere (product_id, change_date) in (select product_id, max(change_date)from productswhere change_date <= '2019-08-16'group by product_id)
) as p2 -- 在 2019-08-16 之前有过修改的产品和最新的价格
on p1.product_id = p2.product_id

(6)最后一个进巴士的人

题目描述

SELECT a.person_name
FROM Queue a, Queue b
WHERE a.turn >= b.turn
GROUP BY a.person_id HAVING SUM(b.weight) <= 1000
ORDER BY a.turn DESC
LIMIT 1

没什么意义,业务逻辑放在SQL里属于自讨苦吃。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Java算法之插入排序(Insertion Sort)
  • 基于STM32的RFID高速收费系统(论文+源码+实物)
  • Github 2024-08-28 C开源项目日报 Top9
  • 基于python的足球比赛数据及可视化 python 足球预测
  • Unet改进11:在不同位置添加MLCA||轻量级的混合本地信道注意机制
  • Xaas傻傻分不清楚,看完这个你就明白了!
  • pgloader 是什么及如何使用?
  • Python数据清洗基础
  • Vmware扩容空间不见的问题
  • C++set与map容器
  • Vue3中 defineProps 与 defineEmits 基本使用
  • django orm的Q和~Q的数据相加并不一定等于总数
  • 影视会员充值API接口如何开发?
  • 生物信息学:DNA序列的构成
  • 大模型battle,哪家才是真的“价美”也“物美”
  • 【跃迁之路】【463天】刻意练习系列222(2018.05.14)
  • 0基础学习移动端适配
  • 2017 年终总结 —— 在路上
  • AHK 中 = 和 == 等比较运算符的用法
  • eclipse的离线汉化
  • Koa2 之文件上传下载
  • Laravel Telescope:优雅的应用调试工具
  • node和express搭建代理服务器(源码)
  • PHP的类修饰符与访问修饰符
  • Python 反序列化安全问题(二)
  • SOFAMosn配置模型
  • SpringCloud(第 039 篇)链接Mysql数据库,通过JpaRepository编写数据库访问
  • thinkphp5.1 easywechat4 微信第三方开放平台
  • Vue2 SSR 的优化之旅
  • XML已死 ?
  • 程序员最讨厌的9句话,你可有补充?
  • 云大使推广中的常见热门问题
  • ​软考-高级-系统架构设计师教程(清华第2版)【第12章 信息系统架构设计理论与实践(P420~465)-思维导图】​
  • ###51单片机学习(1)-----单片机烧录软件的使用,以及如何建立一个工程项目
  • #pragma预处理命令
  • (13)DroneCAN 适配器节点(一)
  • (14)目标检测_SSD训练代码基于pytorch搭建代码
  • (2)STM32单片机上位机
  • (html转换)StringEscapeUtils类的转义与反转义方法
  • (Redis使用系列) SpringBoot 中对应2.0.x版本的Redis配置 一
  • (附源码)springboot家庭财务分析系统 毕业设计641323
  • (附源码)springboot猪场管理系统 毕业设计 160901
  • (九)One-Wire总线-DS18B20
  • (九十四)函数和二维数组
  • (四)stm32之通信协议
  • (自适应手机端)响应式服装服饰外贸企业网站模板
  • .360、.halo勒索病毒的最新威胁:如何恢复您的数据?
  • .net core 6 redis操作类
  • .net core 源码_ASP.NET Core之Identity源码学习
  • .NET 药厂业务系统 CPU爆高分析
  • .net最好用的JSON类Newtonsoft.Json获取多级数据SelectToken
  • @Bean, @Component, @Configuration简析
  • [AR Foundation] 人脸检测的流程
  • [C/C++随笔] char与unsigned char区别
  • [CISCN2019 华东南赛区]Web4