LOGO OA教程 ERP教程 模切知识交流 PMS教程 CRM教程 开发文档 其他文档  
 
网站管理员

SQLite 聚合函数:数据分析的强大工具

admin
2024年11月20日 14:3 本文热度 110

聚合函数是 SQL 中非常重要的一类函数,它们能够对一组值进行计算,并返回单一结果。这些函数在数据分析、报表生成和复杂查询中扮演着关键角色。本文将深入探讨 SQLite 聚合函数的各个方面,包括其定义、类型、用法、高级特性以及最佳实践。

什么是聚合函数?

聚合函数是对一组值执行计算并返回单个结果的函数。它们通常用于数据汇总、统计分析和报表生成。聚合函数在处理大量数据时特别有用,可以快速提供数据的概览和洞察。

SQLite 中的标准聚合函数

SQLite 提供了以下标准聚合函数:

  1. count()
    :计算行数或非 NULL 值的数量。
  2. sum()
    :计算一组数值的总和。
  3. avg()
    :计算一组数值的平均值。
  4. max()
    :返回一组值中的最大值。
  5. min()
    :返回一组值中的最小值。
  6. group_concat()
    :将一组字符串连接成一个字符串。
  7. total()
    :类似于 sum(),但返回浮点数。

准备测试数据

-- 创建员工表  
CREATE 
TABLE employees (  
    
id 
INTEGER PRIMARY KEY AUTOINCREMENT,  
    
name 
TEXT 
NOT 
NULL,  
    department TEXT 
NOT 
NULL,  
    salary REAL  

);  

-- 创建部门字段的索引以优化GROUP BY查询  
CREATE 
INDEX idx_department ON employees(department);  

-- 插入示例数据  
INSERT 
INTO employees (name, department, salary) VALUES  

('张三''人力资源'60000),  
('李四''工程部'75000),  
('王五''人力资源'50000),  
('赵六''工程部'80000),  
('钱七''销售部'55000),  
('孙八''销售部'45000),  
('周九''工程部'70000),  
('吴十''人力资源'48000),  
('郑十一''销售部'62000),  
('刘十二''工程部'85000);  

聚合函数的基本用法

以下是一些基本用法示例:

-- 计算总行数
SELECT 
count(*) FROM employees;

-- 计算工资总和
SELECT 
sum(salary) FROM employees;

-- 计算平均工资
SELECT 
avg(salary) FROM employees;

-- 找出最高工资
SELECT 
max(salary) FROM employees;

-- 找出最低工资
SELECT 
min(salary) FROM employees;

-- 连接所有员工姓名
SELECT 
group_concat(name', 'FROM employees;

GROUP BY 子句与聚合函数

GROUP BY 子句通常与聚合函数一起使用,用于对数据进行分组计算:

-- 按部门计算平均工资
SELECT department, avg(salary) AS avg_salary
FROM employees
GROUP 
BY department;

-- 计算每个部门的员工数量
SELECT department, count(*) AS employee_count
FROM employees
GROUP 
BY department;

HAVING 子句

HAVING 子句用于过滤分组后的结果:

-- 找出平均工资超过 50000 的部门
SELECT department, avg(salary) AS avg_salary
FROM employees
GROUP 
BY department
HAVING avg_salary > 50000;

窗口函数中的聚合

从 SQLite 3.25.0 版本开始,支持窗口函数,这允许在更复杂的场景中使用聚合函数:

-- 计算每个员工的工资和部门平均工资
SELECT 
name, salary,
       
avg(salary) OVER (PARTITION 
BY department) AS dept_avg_salary
FROM employees;

-- 计算累计工资总和
SELECT 
name, salary,
       
sum(salary) OVER (ORDER 
BY salary) AS running_total
FROM employees;

自定义聚合函数

SQLite 允许创建自定义聚合函数。这通常通过 C API 或特定语言的绑定来实现。例如,可以创建一个计算中位数的函数:

// C 代码示例(简化版)
static 
void 
medianStep(sqlite3_context *context, int argc, sqlite3_value **argv) 
{
    
// 实现步骤逻辑
}

static 
void 
medianFinalize(sqlite3_context *context) 
{
    
// 实现最终计算逻辑
}

// 注册函数
sqlite3_create_function(db, "median"1, SQLITE_UTF8, NULLNULL, medianStep, medianFinalize);

使用自定义函数:

SELECT 
median(salary) FROM employees;

聚合函数的高级用法

  1. 条件聚合

    使用 CASE 语句进行条件聚合:

SELECT 

  
count(CASE 
WHEN salary > 50000 
THEN 
1 
ENDAS high_salary_count,
  
count(CASE 
WHEN salary <= 50000 
THEN 
1 
ENDAS low_salary_count
FROM employees;
  1. 嵌套聚合

    在某些情况下可以嵌套使用聚合函数:

SELECT 
avg(total_salary) AS avg_dept_total
FROM (
  
SELECT department, sum(salary) AS total_salary
  
FROM employees
  
GROUP 
BY department
);
  1. 聚合函数与子查询
SELECT 
name, salary,
  (SELECT 
avg(salary) FROM employees) AS overall_avg_salary
FROM employees;

聚合函数与 NULL 值

聚合函数处理 NULL 值的方式:

  • count(*)
    :包括 NULL 值在内的所有行。
  • count(column)
    :不包括 NULL 值。
  • sum(), avg(), max(), min()
    :忽略 NULL 值。

示例:

SELECT 

  
count(*) AS total_rows,
  
count(salary) AS salary_count,
  
avg(salary) AS avg_salary
FROM employees;

聚合函数的性能考虑

  1. 索引使用
    :确保 GROUP BY 子句中的列有适当的索引。
  2. 内存使用
    :大量数据的聚合可能消耗大量内存。
  3. 分批处理
    :对于大数据集,考虑分批处理或使用临时表。
  4. 避免过度使用
    :复杂的聚合查询可能影响性能,考虑在应用层处理部分逻辑。

结论

SQLite 的聚合函数是进行数据分析和生成报告的强大工具。从基本的计数和求和到复杂的条件聚合和窗口函数,这些功能为数据处理提供了极大的灵活性。正确使用聚合函数不仅可以简化查询逻辑,还能显著提高数据处理的效率。


该文章在 2024/11/20 16:30:52 编辑过
关键字查询
相关文章
正在查询...
点晴ERP是一款针对中小制造业的专业生产管理软件系统,系统成熟度和易用性得到了国内大量中小企业的青睐。
点晴PMS码头管理系统主要针对港口码头集装箱与散货日常运作、调度、堆场、车队、财务费用、相关报表等业务管理,结合码头的业务特点,围绕调度、堆场作业而开发的。集技术的先进性、管理的有效性于一体,是物流码头及其他港口类企业的高效ERP管理信息系统。
点晴WMS仓储管理系统提供了货物产品管理,销售管理,采购管理,仓储管理,仓库管理,保质期管理,货位管理,库位管理,生产管理,WMS管理系统,标签打印,条形码,二维码管理,批号管理软件。
点晴免费OA是一款软件和通用服务都免费,不限功能、不限时间、不限用户的免费OA协同办公管理系统。
Copyright 2010-2024 ClickSun All Rights Reserved