php判断邮箱怎么写,PHP可以自学吗?
黑马程序员搭建环境PHP简介什么是PHP
PHP定义:一种服务器端的 HTML 脚本/编程语言,是一种简单的、面向对象的、解释型的、健壮的、安全的、性能非常之高的、独立于架构的、可移植的、动态的脚本语言。是一种广泛用于 Open Source(开放源代码)的尤其适合 Web 开发并可以嵌入 HTML 的多用途脚本语言。它的语法接近 C,Java 和 Perl,而且容易学习。该语言让 Web 开发人员快速的书写动态生成的网页。PHP前身:Personal HomePage,个人主页,使用Perl语言开发的一种写个人主页的语言PHP:PHP Hypertext Preprosessor,php超文本预处理器,底层使用C语言PHP发展史
Rasmus Lerdorf :创建者1994:1.0,个人perl,非常简单(简陋)1996:2.0,C底层,变的相对比较强大1998:3.0,zendEngine,联合zend公司共同管理和维护PHP,zendEngine(zend引擎)用户高效的解析php代码2000:4.0,session+输出缓冲等,session技术(会话技术),2004:5.0,zend引擎2代,增加新技术(面向对象更新,命名空间,异常)2015:7.0,新版的ZendEngine引擎,性能提升,新特性(异常)平台支持(window,Linux,UNIX)数据库支持(Sqlserver,mysql,Oracle,Access)静态网站与动态网站的区别
静态网站:web1.0时代动态网站:web2.0时代网站
Website的中文名称是网站,是指在互联网上,根据一定的规则,使用HTML、PHP等代码语言制作的用于展示特定内容的相关网页的集合,有可供管理人员操作的后台及用户使用的前台。简单地说,Website是一种通讯工具,就像布告栏一样,人们可以通过Website来发布自己想要公开的资讯,或者利用Website来提供相关的网络服务。人们可以通过网页浏览器来访问Website,获取自己需要的资讯或者享受网络服务。静态网站特点
1.网页内容一经发布到网站服务器上,无论是否有用户访问,每个静态网页的内容都是保存在网站服务器上的,也就是说,静态网页是实实在在保存在服务器上的文件,每个网页都是一个独立的文件;2.静态网页的内容相对稳定,因此容易被搜索引擎检索;3.静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时完全依靠静态网页制作方式比较困难;4.静态网页的交互性较差,在功能方面有较大的限制。动态网站特点
1.交互性:网页会根据用户的要求和选择而动态地改变和响应,浏览器作为客户端,成为一个动态交流的桥梁,动态网页的交互性也是今后Web发展的潮流。2.自动更新:即无须手动更新HTML文档,便会自动生成新页面,可以大大节省工作量。3.因时因人而变:即当不同时间、不同用户访问同一网址时会出现不同页面。此外动态网页是与静态网页相对应的,也就是说,网页URL的后缀不是.htm、.html、.shtml、.xml等静态网页的常见形式,而是以.asp、.jsp、.php、.perl、.cgi等形式为后缀。在动态网页网址中有一个标志性的符号——“?”网站基本概念服务器概念
服务器(server),也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。服务器的构成包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。在网络环境下,根据服务器提供的服务类型不同,分为文件服务器,数据库服务器,应用程序服务器,WEB服务器等。服务器:能够提供服务的机器,取决于机器上所安装的软件(服务软件)Web服务器:提供web服务(网站访问),就需要安装web服务软件,Apache,tomcat,iis等IP的概念
IP:Internet Protocol,网络之间互联协议。网络之间互连的协议也就是为计算机网络相互连接进行通信而设计的协议。在因特网中,它是能使连接到网上的所有计算机网络实现相互通信的一套规则,规定了计算机在因特网上进行通信时应当遵守的规则。任何厂家生产的计算机系统,只要遵守IP协议就可以与因特网互连互通。IP地址具有唯一性。(每台电脑都有一个唯一的IP地址)域名
域名(Domain Name),是由一串用点分隔的名字组成(www.itcast.cn)的Internet上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置,地理上的域名,指代有行政自主权的一个地方区域)。域名是一个IP地址上有“面具” 。一个域名的目的是便于记忆和沟通的一组服务器的地址(网站,电子邮件,FTP等)。域名作为力所能及难忘的互联网参与者的名称。特殊IP:127.0.0.1,代表本机特殊域名:localhostDNS
DNS(Domain Name System,域名系统),因特网上作为域名和IP地址相互映射的一个分布式数据库,能够使用户更方便的访问互联网,而不用去记住能够被机器直接读取的IP数串。通过主机名,最终得到该主机名对应的IP地址的过程叫做域名解析(或主机名解析)。用户输入域名localhost—》DNS(localhost 127.0.0.1)--》服务器电脑端口
端口(Port),可以认为是设备与外界通讯交流的出口。端口可分为虚拟端口和物理端口,其中虚拟端口指计算机内部或交换机路由器内的端口,不可见。例如计算机中的80端口、21端口、23端口等。物理端口又称为接口,是可见端口,计算机背板的RJ45网口,交换机路由器集线器等RJ45端口。用户输入域名localhost:端口—》DNS(localhost 127.0.0.1)--》服务器电脑—》软件(服务)Web程序的访问流程
Web分为两类:静态网站和动态网站浏览器发起访问—》DNS解析域名—》服务器电脑---》服务软件静态网站访问
动态网站访问
动态网站访问流程与静态差不多,但是会多出几个内容:服务器端解析、数据库安装Apache安装Apache软件
1、 获取Apache安装软件2、 双击安装即可:指定对应的路径:E:server/apache3、选择安装模式:使用自定义模式4、 选择安装位置Apache的目录结构说明
Httpd.exe的详细应用
1、 服务器进程:运行之后才能够工作2、 用来查看Apache具有哪些功能以及配置文件是否有错:httpd或者httpd.exe(文件所在目录)2.1 查看使用的模块:httpd -M2.2 验证配置文件是否有效:httpd –t配置默认站点
1、 让Apache确定服务器上访问的位置:网站文件夹所在位置Httpd.conf:DocumentRoot2、 方便用户使用名字访问对应的网站:给文件夹对应的取一个别名Httpd.conf:ServerName端口可以单独实现:httpd.conf:listen3、 凡是涉及到Apache配置文件的修改,那么需要重启Apache才能生效4、 实现DNS域名解析:通常默认站点都是本地DNS:hosts文件安装与配置PHP安装PHP语言
1、 获取PHP安装文件:建议去官网2、 解压缩3、 安装:将解压后的文件放到E:/server/,重命名PHP5PHP的目录结构说明
php.exe的应用
PHP.exe就是可以解析PHP代码转变成HTML代码从而让浏览器可以解析的。1、 通过CMD控制器进入到php.exe所在目录2、 通过php.exe运行命令来指定要解析的PHP脚本就可以:php.exe -f PHP文件所在路径配置Apache加载PHP模块
1、 Apache加载PHP模块:在Apache的主配置文件(httpd.conf)中加载对应的PHP提供的模块LoadModule php5_module PHP所提供的模块链接所在路径2、 Apache分配工作给PHP模块:如果是PHP代码就交给PHP处理:文件后缀判断.php结尾肯定是PHP代码AddType application/x-httpd-php .php3、 将PHP的配置文件加载到Apache配置文件中:共同生效3.1 在Apache中指定PHP配置文件所在路径PHPIniDir php.ini所在路径3.2 php.ini文件默认是不存在的,是以development和production格式存在,需要格式化说明:PHP的配置文件已经加入到Apache的配置项中,意味着php.ini的修改需要Apache重启才会生效。安装与配置MySQL安装MySQL软件
1、 获取MySQL安装软件2、 双击安装即可:没有特殊情况的直接下一步就可以完成3、 选择custom,自定义安装:选择安装路径3.1 软件安装目录:server/mysql3.2 数据安装目录:server/mysql/data4、 在完成安装之后,要实现配置5、 选择详细配置(默认的)6、 选择开发环境:默认的7、 选择功能:默认8、 并发设置(建议手动)9、 配置访问环境10、 字符集设定:系统字符集11、 服务安装:将MySQL作为windows下的一个服务启动12、 输入root(超级管理员)的用户密码13、 等待配置:4个都是勾表示安装成功MySQL的目录结构说明 Bin目录的常用命令
软件设计结构:C/S和B/SC/S:Client客户端/Server服务端,用户需要安装客户端产品才能访问服务器,而且只能访问一种软件(当前自己)B/S:Browser浏览器/Server服务端,用户只需要安装浏览器,就可以访问所有的服务器(B/S架构服务)MySQL的访问流程
Mysql是一款C/S架构的软件,需要通过客户端来访问服务端(MySQL提示也提供了其他模式的访问:通过一些插件扩展来充当客户端)1、 启用MySQL客户端:mysql.exe,该软件本身可以通过CMD控制台运行本身客户端:mysql.exeMysql.exe通过cmd运行2、 MySQL客户端访问服务端需要进行寻找匹配:连接认证连接:IP和端口确认,如果是本地都可以省略-h主机地址----》-hlocalhost(可以是IP)-P端口---》-P3306认证:通过用户名和密码进入服务器-u用户名---》-uroot,不可以省略(匿名用户除外)-p密码---》-proot3、 退出命名:\q注意:通常连接认证的时候密码不建议明文,可以在输入-p之后回车,系统会再次让输入密码,这个时候就是密文PHP连接MySQL数据库
PHP本身不具备操作MySQL数据库的能力,需要借助PHP操作MySQL的扩展来实现。1、 PHP加载MySQL扩展:php.ini文件中2、 PHP中所有的扩展都是在ext文件夹中,需要制定扩展所在路径:extension_dir3、 php.ini已经被Apache加载,所以需要重启才会生效。设定PHP的系统时区
通过php.ini中的timezone配置项来实现配置虚拟主机
一台服务器很贵,如果只能部署一个网站,那么非常浪费。所以需要通过其他渠道来实现一台主机上部署多个网站。什么是虚拟主机
虚拟主机:Virtual machine,并不存在真实的主机,但是可以提供真实主机所实现的功能。通俗的讲,虚拟主机就是将计算机中不同的文件夹进行不同的命名,然后可以实现让服务器(Apache)根据用户的需求从不同的文件夹(网站)中读取不同的内容。虚拟主机的分类
在Apache中,可以将虚拟主机划分成两类:1、 基于IP的虚拟主机:一台电脑上有多个IP,每个IP对应一个网站原理:电脑默认只有一个IP,因为通常只配有一个网卡;但是有的电脑(服务器居多)可以配置多个网卡,每个网卡可以绑定一个IP地址。2、 基于域名的虚拟主机:一台电脑上只有一个IP,但是IP下可以制作多个网站,但是需要给每个网站不同的名字(虚拟主机名)搭建基于域名的虚拟主机
在Apache中,虚拟主机的搭建有两种方式:1、 在主配置文件中搭建:需要手动开启虚拟主机(基于域名)NameVirtualHost *:802、 在专门的虚拟主机配置文件中配置2.1 在主配置文件中加载虚拟主机配置文件(httpd.conf):虚拟主机配置文件已经开启了虚拟主机NameVirtualHost2.2 虚拟主机从配置文件(extra/httpd-vhosts.conf)中配置虚拟主机①增加一个对应的站点文件夹位置:DocumentRoot②增加主机名字:文件夹的别名:ServerName③ 增加域名解析DNS:hosts④需要给当前设定的站点(目录)访问权限<Directory ‘站点目录’>Order Deny,Allow //没有顺序关系:实际顺序有意义Deny from 指定的范围Allow from 指定范围/all</Directory>⑤ 配置访问列表:当访问是一个目录时候(没有指定具体要访问的文件)Options Indexes [FollowSymLinks],如果访问目录,那么列表显示所有文件⑥ 当用户访问指定目录不指定文件的时候,通常需要系统指定一个默认文件DirectoryIndex 默认的文件列表,使用空格分离注意:如果说网站中整个网站根目录允许访问,但是其中还有其他文件夹不允许访问:可以增加多个Directory标签,针对不同的文件夹3、 一旦启用虚拟主机配置文件,那么默认的主机地址localhost就不再生效,如果想要生效:为localhost增加单独的虚拟主机你电脑上最引以为豪的软件是什么?
那必须是云表啊!我每天都在用这个软件处理业务,效率不知道翻了多少倍!(文末有免费获取方式,请留意自取噢)
它不仅仅是一款软件,而是可以生产软件的软件以往企业购买一套特定的软件,只能解决一个特定的问题,功能既不能扩展,也不能进行变更。
而云表却不同,它不仅仅是单一的解决方案。
确切来讲,它是一款业务操作系统,企业可以通过它,与各种异构业务系统连接,也可以基于它开发出各种类型的业务应用。
比如说,ERP、WMS、OA、BI、MES、CRM、进销存、薪资管理、HR管理、供应链管理、供应商管理等,任何一套业务管理软件,都是可以通过云表搭建出来的,功能随需增删查改。
此外,它还是一款0代码开发平台。
相比于传统的代码开发,0代码的开发方式,效率提高至5~8倍。
不仅彻底解决了传统的烟囱式垂直应用,带来的信息孤岛和数据融合的问题,更是给从小到大等各行业领域的企业,提供了数字化、信息化等科学有效的决策方案。
功能比excel强大,普通人就能上手,还能设置权限,满足海量用户在线协同办公云表,作为一款企业级的管理应用开发平台。使得中小企业可以根据自身需求,搭建从生产管理、计划调度到管理决策、动态生长的生态系统,覆盖从小企业到大企业的全生长周期和全生命周期。
与DataFocus配合,轻松定制完美数据看板。数据分析实时交互,完全满足管理决策中经常遇到的临时性分析、多变的业务需求和频繁的结果刷新。
让IT部门,从此告别延时报表分析,亿级数据秒级响应。
很多用excel处理报表表单的烦恼是,excel没有权限控制,多人协同乏力。
而使用云表,可以精确到行、列的细粒度数据权限控制。
固化的分析报表或数据看板,只需要制作一份,再根据权限配置,即可实现千人千面的数据展示效果。
另外,它还支持多业务系统的单点登录,各系统间数据互通,主流信息无缝集成,海量用户在线办公,丝毫不存在压力。
这时候你要问了,功能这么强大,学起来应该很难吧?
我得纠正一下,一点也不困难。普通人,用零碎时间就能完全上手,毫不夸张的说哦,10天就能自己动手开发一套业务应用。
全中文操作,使用者不用写一行代码,也不用了解数据库(因为云表内嵌了MySQL数据库,系统自动升级维护,当然,如果你要求较高,也可以根据步骤,自行配置SQL server或者Oracle数据库),只要你懂业务,就算你是只有初中文化水平的中年普通人,也能驾驭它。
在酷似excel的界面,复制、粘贴、拖放、对齐、填表公式、业务公式、主表明细,就能玩转云表,轻轻松松开发表单和业务应用,符合大多数人的使用习惯。
而且,它还有一键生成移动端APP的功能,实现手机与电脑的内容同步。
提供免费版本,500强企业验证云表,是有提供永久免费版本的(5并发以内)。
目前,像中国电信、华为、首钢、中铁、中冶、海尔、国家道路与桥梁工程检测设备计量站、燕山大学等500强企业、国企、央企以及知名高校,都在使用着云表。这款企业级的管理应用,已经成为了,20万+企业或高校的必备办公软件,学习云表的业务人员纷至沓来。
说了那么多,相信你已经摩拳擦掌,跃跃欲试了吧!这就奉上免费的软件获取方式!
获取方式
1、点赞+转发+评论留言
2、关注我并点击我头像,私信发送:cc
虽然上手容易,但是你不动手的话,很难感受到它的强大!这就是我电脑上“最引以为豪”的软件!
怎么样?有没有傻眼?
roundcube是什么邮箱?
RoundCube Webmail是一个基于浏览器,支持多国语言的IMAP客户端,操作界面看起像一个桌面应用程序。它提供一个e-mail客户端应该具备的所有功能包括MIME支持,地址薄,文件夹操作,信息搜索和拼写检查。RoundCube Webmail采用PHP+Ajax开发并且需要MySQL数据库来存储数据。 用户界面采用XHTML+CSS2设计。
怎么自学数据分析?
这是一份数据分析师的入门指南,它包含七周的内容,Excel、数据可视化、数据分析思维、数据库、统计学、业务、以及Python。
每一周的内容,都有两到三篇文章细致讲解,帮助新人们快速掌握。这七周的内容刚好涵盖了一位数据分析师需要掌握的基础体系,也是一位新人从零迈入数据大门的知识手册。
第一周:Excel
每一位数据分析师都脱离不开Excel。
它是日常工作中最常用的工具,如果不考虑性能和数据量,它可以应付绝大部分分析工作。虽然现在机器学习满地走,Excel依旧是无可争议的第一工具。
Excel的学习分为两个部分。
掌握各类功能强大的函数,函数是一种负责输入和输出的神秘盒子。把各类数据输入,经过计算和转换输出我们想要的结果。
在SQL,Python以及R中,函数依旧是主角。掌握Excel的函数有助于后续的学习,因为你几乎在编程中能找到名字一样或者相近的函数。
在「数据分析:常见的Excel函数全部涵盖在这里了」中,介绍了常用的Excel函数。
清洗处理类:trim、concatenate、replace、substitute、left/right/mid、len/lenb、find、search、text
关联匹配类:lookup、vlookup、index、match、row、column、offset
逻辑运算类:if、and、or、is系列
计算统计类:sum/sumif/sumifs、sumproduct、count/countif/countifs、max、min、rank、rand/randbetween、averagea、quartile、stdev、substotal、int/round
时间序列类:year、month、weekday、weeknum、day、date、now、today、datedif
搜索能力是掌握Excel的不二窍门,工作中的任何问题都是可以找到答案。
第二部分是Excel中的工具。
在「数据分析:Excel技巧大揭秘」教程,介绍了Excel最具性价比的几个技巧。包括数据透视表、格式转换、数组、条件格式、自定义下拉菜单等。正是这些工具,才让Excel在分析领域经久不衰。
在大数据量的处理上,微软提供了Power系列,它和Excel嵌套,能应付百万级别的数据处理,弥补了Excel的不足。
Excel需要反复练习,实战教程「数据分析:手把手教你Excel实战」,它通过网络上抓取的数据分析师薪资数据作为练习,各类函数的使用。
除了上述要点,下面是附加的知识点,铺平数据分析师以后的道路。
了解单元格格式,数据分析师会和各种数据类型打交道,包括各类timestamp,date,string,int,bigint,char,factor,float等。
了解数组,以及相关应用(excel的数组挺难用),Python和R也会涉及到 list,是核心概念之一。
了解函数,深入理解各种参数的作用。它会在学习Python中帮助到你。
了解中文编码,UTF8、GBK、ASCII,这是数据分析师的坑点之一。
第二周:数据可视化
数据分析界有一句经典名言,字不如表,表不如图。
数据可视化是分析的常用技巧之一,不少数据分析师的工作就是通过图表观察和监控数据。首先了解常用的图表:
Excel的图表可以100%绘制上面的图形,但这只是基础。
在「数据可视化:你想知道的经典图表全在这」中介绍了各类数据分析的经典图表,除了趋势图、直方图,还包括桑基图、空间图、热力图等额外的类型。
数据可视化不是图表的美化,而是呈现数据的逻辑之美,是揭示数据的内在关联。了解图表的维度和适用场景,比好看更重要。比如桑吉图就是我一直推崇的图表,它并不知名,但是它能清晰的揭露数据内在状态的变化和流向。案例是用户活跃状态的趋势。
Excel的图表操作很傻瓜化,其依旧能打造出一份功能强大的可视化报表。「数据可视化:教你打造升职加薪的报表」教给大家常用的Excel绘图技巧,包括配色选取,无用元素的剔除、辅助线的设立、复合图表等方法。
Excel图表的创造力是由人决定的,对数据的理解,观察和认知,以及对可视化的应用,这是一条很长的道路。
图表是单一的,当面板上绘制了多张图表,并且互相间有关联,我们常称之为Dashboard仪表盘。
上图就是用分析师薪资数据为数据源绘制的Dashboard,比单元格直观不少。我们常常把绘制这类Dashboard的工具叫做BI。
BI(商业智能)主要有两种用途。一种是利用BI制作自动化报表,数据类工作每天都会接触大量数据,并且需要整理汇总,这是一块很大的工作量。这部分工作完全可以交给BI自动化完成,从数据规整、建模到下载。
另外一种是使用其可视化功能进行分析,它提供比Excel更丰富的交互功能,操作简单,而且美观,如果大家每天作图需要两小时,BI能缩短大半。
在「数据可视化:手把手打造BI」教程中,以微软的PowerBI举例,教大家如何读取数据,规整和清洗数据,绘制图表以及建立Dashboard。最后的成果就是上文列举的分析师案例。
BI还有几个核心概念,包括OLAP,数据的联动,钻取,切片等,都是多维分析的技巧,也是分析的核心方法之一。
后续的进阶可视化,将和编程配合。因为编程能够提供更高效率和灵活的应用。而BI也是技术方向的工具,了解技术知识对应用大有帮助。
第三周:数据分析思维数据分析能力的高低,不以工具和技巧决定,而以分析思维决定。
在一场战争中,士兵装备再好的武装,进行再严苛的训练,若是冲锋的方向错了,那么迎接他们的唯有一败涂地。
分析思维决定一场「数据战争」中的冲锋方向。只有先养成正确的分析思维,才能使用好数据。
既然是思维,它就倾向于思考的方式,Excel函数学会了就是学会,分析则不同。大多数人的思维方式都依赖于生活和经验做出直觉性的判断,以「我觉得我认为」展开,好的数据分析首先要有结构化的思维。
麦肯锡是其中领域的佼佼者,创建了一系列分析框架和思维工具。最典型地莫过于金字塔思维。
这篇文章简述了该思维的应用,「快速掌握麦肯锡的分析思维」。你能学会结构化思考,MECE原则,假设先行,关键驱动等方法论。
除此以外,还有SMART、5W2H、SWOT、4P4C、六顶思考帽等,这些都是不同领域的框架。框架的经典在于,短时间内指导新人如何去思考,它未必是最好的,但一定是性价比最优的。数据分析思维,是分析思维的引申应用。再优秀的思考方式,都需要佐证和证明,数据就是派这个用处的,「不是我觉得,而是数据证明」。
现代管理学之父彼得·德鲁克说过一句很经典的话:如果你不能衡量它,那么你就不能有效增长它。如果把它应用在数据领域,就是:如果你不能用指标描述业务,那么你就无法有效增长它。每一位数据分析师都要有指标体系的概念,报表也好,BI也好,即使机器学习,也是围绕指标体系建立的。
下图就是一个典型的指标体系,描述了用户从关注产品、下载、乃至最后离开的整个环节。每一个环节,都有数据及指标以查询监控。
不同业务背景需要的指标体系不同,但有几个建立指标的通用准则。这篇文章深入介绍了「如何建立数据分析的思维框架」。你将区分什么是好指标、什么是坏指标、比率和比例、指标的结构、指标设立的维度等概念。
数据分析不是一个结果,而是一个过程。几乎所有的分析,最终目的都是增长业务。所以比分析思维更重要的是驱动思维落地,把它转化为成果。
数据分析思维是常年累月养成的习惯,一周时间很难训练出来,但这里有一个缩短时间的日常习惯。以生活中的问题出发做练习。
这家商场的人流量是多少?怎么预估?
上海地区的共享单车投放量是多少?怎么预估?
街边口的水果店,每天的销量和利润是多少?怎么预估?
这些开放性问题起源于咨询公司的训练方法,通过不断地练习,肯定能有效提高分析思维。另外就是刷各种CaseBook。
优秀的数据分析师会拷问别人的数据,而他本身的分析也经得起拷问。
第四周:数据库
Excel很容易遇到瓶颈,随着业务的发展,分析师接触的数据会越来越多。对大部分人的电脑,超过十万条数据,已经会影响性能。何况大数据时代就是不缺数据,这时候就需要学习数据库了。
即使非数据岗位,也有越来越多的产品和运营被要求使用SQL。
很多数据分析师戏称自己是跑SQL的,这间接说明SQL在数据分析中有多核心。从Excel到SQL绝对是处理效率的一大进步。
教程内容以MySQL为主,这是互联网行业的通用标准。其实语法差异不大的。
新手首先应该了解表的概念,表和Excel中的sheet类似。「写给新人的数据库指南」是一篇入门基础文章,包括表、ID索引、以及数据库的安装,数据导入等简单知识。
SQL的应用场景,均是围绕select展开。增删改、约束、索引、数据库范式均可以跳过。新手在「SQL,从入门到熟练」教程会学习到最常见的几个语法,select、where、group by、if、count/sum、having、order by、子查询以及各种常用函数。
数据还是分析师薪资数据,它可以和Excel实战篇结合看,不少原理都是相通的。
想要快速掌握,无非是大量的练习。大家可以在leetcode上做SQL相关的练习题,难度从简单到困难都有。「SQL,从熟练到掌握」教程中将会带领大家去刷一遍。
join对新手是一个很绕的概念,教程会从图例讲解,逐步提高难度。从一开始的join关联,到条件关联、空值匹配关联、子查询关联等。最后完成leetcode中的hard模式。
如果想要更进一步,可以学习row_number,substr,convert,contact等函数。不同数据平台的函数会有差异,例如Presto和phpMyAdmin。再想提高,就去了解Explain优化,了解SQL的工作原理,了解数据类型,了解IO。知道为什么union比or的效率快,这已经和不少程序员并驾齐驱。
第五周:统计学
很多数据分析师并不注重统计学基础。
比如产品的AB测试,如果相关人员不清楚置信度的含义和概念,那么好的效果能意味着好么?如果看待显著性?
比如运营一次活动,若不了解描述统计相关的概念,那么如何判别活动在数据上的效果?可别用平均数。
不了解统计学的数据分析师,往往是一个粗糙的分析师。如果你想要往机器学习发展,那么统计学更是需要掌握的基础。
统计知识会教大家以另一个角度看待数据。如果大家了解过《统计数据会撒谎》,那么就知道很多数据分析的决策并不牢靠。
在第一篇教程「解锁数据分析的正确姿势:描述统计」,会教给大家描述统计中的诸多变量,比如平均数、中位数、众数、分位数、标准差、方差。这些统计标准会让新手分析师从平均数这个不靠谱的泥潭中出来。
箱线图就是描述统计的大成者,好的分析师一定是惯用箱线图的常客。
第二篇「解锁数据分析的正确姿势:描述统计(2)」将会结合可视化,对数据的分布进行一个直观的概念讲解。很多特定的模型都有自有的数据分布图,掌握这些分布图对分析的益处不可同日而语。
直方图和箱线图一样,将会是长久伴随分析师的利器。
统计学的一大主要分支是概率论,概率是度量一件事发生的可能性,它是介于0到1之间的数值。很多事情,都可以用概率论解释,「概率论的入门指南」和「读了本文,你就懂了概率分布」都是对其的讲解。
包括贝叶斯公式、二项概率、泊松概率、正态分布等理论。理论不应用现实,那是无根之木,教程中会以运营活动最常见的抽奖概率为讲解,告诉大家怎么玩。
其实数据分析中,概率应用最广泛和最全面的知识点,就是假设检验,大名鼎鼎的AB测试就是基于它的。俗话说得好,再优秀的产品经理也跑不过一半AB测试。
何为假设检验?假设检验是对预设条件的估计,通过样本数据对假设的真伪进行判断。
产品改版了,用户究竟喜不喜欢?调研的评分下降了,这是用户的评价降低了,还是正常的数据波动呢?这些都是可以做假设检验的。它可以说是两面两篇文章的回顾和应用。
「数据分析必须懂的假设检验」依旧以互联网场景讲解各种统计技巧的应用。假设检验并不难,通过Excel的几个函数就能完成。它的难点在于诸多知识点和业务的结合使用,实际公式不需要掌握的多透彻,了解背后的意义更重要。
统计学是一个很广阔的领域,包括方差分析,时间序列等,都有各自不同的应用。大家若感兴趣,可以去阅读各类教材,没错,教材是学习统计学最优的方式。我这类文章堪堪算入门罢了。
第六周:业务
对于数据分析师来说,业务的了解比数据方法论更重要。举个例子,一家O2O配送公司发现在重庆地区,外卖员的送货效率低于其他城市,导致用户的好评率降低。总部的数据分析师建立了各个指标去分析原因,都没有找出来问题。后来在访谈中发觉,因为重庆是山城,路面高低落差比较夸张,很多外卖人员的小电瓶上不了坡…所以导致送货效率慢。这个案例中,我们只知道送货员的送货水平距离,根本不知道垂直距离。这是数据的局限,也是只会看数据的分析师和接地气分析师的最大差异。业务形态千千万万,数据分析师往往难窥一二。我的公众号业务部分也涉及了不少,大家可以通过这几篇文章了解。
一篇文章读懂活跃数据;深入浅出,用户生命周期的运营;获取新增用户,运营都应该知道的事;运营的商业逻辑:CAC和CLV;从零开始,构建数据化运营体系;读懂用户运营体系:用户分层和分群,这些都是互联网运营相关的内容,或多或少涉及了不少业务方面的概念,数据分析人员可以选择性的挑选部分内容。了解业务的数据分析师在职场发展上会更加顺利。
而在「最用心的运营数据指标解读」中,我尝试了几个泛互联网领域的指标和业务模型,它们都是通用的框架。
产品运营模型:以移动端APP为主体,围绕AARRR准则搭建起数据框架。包括Acquisition用户获取、Activation用户活跃、Retention用户留存、Revenue营收、Refer传播,以及细分指标。
市场营销模型:以传统的市场营销方法论为基底,围绕用户的生命周期建立框架。包括用户生命周期,生命周期价值、用户忠诚指数、用户流失指数、用户RFM价值等。
流量模型:从早期的网站分析发展而来,以互联网的流量为核心。包括浏览量曝光率、病毒传播周期、用户分享率、停留时间、退出率跳出率等。
电商和消费模型:以商品的交易、零售、购买搭建而起。包括GMV、客单价、复购率、回购率、退货率、购物篮大小、进销存,也包含SKU、SPU等商品概念。
用户行为模型:通过用户在产品功能上的使用,获得精细的人群维度,以此作为分析模型。包括用户偏好、用户兴趣、用户响应率、用户画像、用户分层,还包含点赞评论浏览收藏等功能的相关指标。
除了上述的几个常见模型,数据分析还有其他分支。比如SEO/SEM,虽然可以归类到流量模型,但它并不简单。比如财务分析,商业的各种成本支出也需要专人负责。
在业务知识外,业务层面的沟通也很重要。业务线足够长的时候,沟通往往成为老大难的问题。
业务学习没有捷径,哪怕掌握了诸多模型,不同行业间的业务壁垒会是分析师们的门槛。金融的各类专有领域知识,电子商务不同产品的特性,这些都会影响到分析报告的质量。
在早期,新人最好选择一到两个领域深入了解其业务,然后以此拓展边界。
第七周:Python/R
第七周是最后的学习环节。
是否具备编程能力,是初级数据分析和高级数据分析的风水岭。数据挖掘、BI、爬虫、可视化报表都需要用到编程。掌握一门优秀的编程语言,可以让数据分析师升职加薪,迎娶白富美。数据分析领域最热门的两大语言是R和Python。R的优点是统计学家编写的,缺点也是统计学家编写。涉及各类统计函数和工具的调用,R无疑有优势。但是大数据量的处理力有不逮,学习曲线比较陡峭。
Python则是万能的胶水语言,适用性强,可以将分析的过程脚本化。Pandas、Numpy、SKLearn等包也是非常丰富。
这里的教程以Python为主。
「开始Python的新手教程」将会教大家搭建数据分析环境,Anaconda是功能强大的数据科学工具。Python建议安装Python3+版本,不要选择Python2了。
Python的语法相当简洁,大家print出第一个hello world顶多半小时。就像在Excel上进行运算一样方便。
「开始Python的数据结构」介绍给大家Python的三类数据结构,列表list,元组tuple,以及字典dict。万变不离其宗,掌握这三种数据结构以及相对应的函数,足够应付80%的分析场景。函数式编程为Python一大特色,Python自身就提供不少丰富的函数。很多都和Excel的函数相通,掌握起来非常迅速。另外还有控制流,for、while、if,通常配合函数组合使用。
「了解和掌握Python的函数」教大家如何自定义函数,丰富的函数虽然能偷懒,但是不少场景下,还是需要自己动手撸一个。
能够调第三方包解决,就使用第三方的函数。如果是一个频繁使用的场景,而第三方依靠不了,就自己编一个函数。如果是临时性的场景,写得粗糙点也无所谓。毕竟分析师的代码能力不要求工程师那么严格,所以Python的学习尽量以应用为主,不用像分析师那么严格。
包、模块和类的概念属于进阶知识,不学也不要紧。
「Python的数据分析: numpy和pandas入门」介绍了数据分析师赖以生存的两个包,numpy和pandas,其他Python知识可以不扎实,这两个最好认真掌握。它是往后很多技能树的前置要求。
array,series,dataframe是numpy和pandas的三个数据结构,掌握它们,便算是入门了。后续的两篇教程都是实战。
「用pandas进行数据分析实战」以分析师的薪资作为实战数据。Excel、BI、SQL,一路走来,大家想必对它无比熟悉,这也是最后一次使用它了。教程通过Pandas的各类功能,绘制出一副词云图。
有哪些资源强大的电子书推荐?
资源强大的电子书,问对人了!小编精心整理了11个高质量电子书下载网站,绝大多数的电子书都可以从这里免费获得,再也不用担心想看的书籍、资料要钱啦~
废话不说,直接给干货!
文末有30+职场电子书PDF,领取方式文末有!!1.书格书格是一个自由开放的在线古籍图书馆,主要就是分享一些高清的古籍图书和画本,都是免费的。新版资源已经更新了219套,随便点进去一个就有详细的介绍,还能下载PDF文件。2.读秀学术搜索搜下图的网址就可以了,听名字你也可以知道,这是一款收集学术论文期刊的网站,但是它更有海量的电子书资源,可以直接阅读或者免费下载,省时省力。
3.时宜搜书导航时宜搜书是一个电子书籍聚合检索的资源库,里面收录了各种网站的书籍链接,点击的时候可以直接跳转到原网站进行下载。
4.Many booksMany books的电子书资源大部分为文学著作类,5万多本电子书籍免费阅读或下载。而且,站内还有详细的分类,十分便于我们的搜索。
5.搬书匠搬书匠是一个完全免费的计算机电子书籍下载站点,基本上覆盖了市面上全部优质的计算机电子书籍,非常适合计算机学习爱好者。
里面的电子书籍可以直接保存到百度网盘中,可在网盘中阅读及下载,没有任何垃圾广告。
6.LoreFreeLoreFree是一个开放式的电子书下载网站,任何人都可以在这个网站中上传电子书,所以里面的电子书资源十分丰富,现已具备电子书7万册以上。
里面的每一本电子书都具备多种版本可供选择,而且无需注册即可直接将电子书下载到本地。
7.京东读书专业版这是一个专为大学生提供电子书阅读服务的平台。20万电子书,不需要下载,登录后直接免费读。平台资源非常丰富,涉及哲学、经济学、法学、文学、历史学、医学、管理学、艺术、工业科技等十多个学科。而且不仅是各类专业书,还有最新最热门的小说,都能在这里尽情畅读。
8.云海电子书云海电子书是一个完全免费的电子书下载网站,里面的电子书资源非常丰富,且分类明确,想看什么电子书直接搜索即可,最主要的是里面的电子书全部可以免费下载。
不过也是存在一定缺点的,那就是该网站中的电子书虽然是免费下载的,但保存的网盘却是诚通网盘,下载速度较慢。
9.书享家书享家也是一个电子书资源整合网站,而且它里面的电子书比熊猫搜书还要多,几乎包含了所有跟电子书有关系网站。
而且这些网站还进行了分类,包括酷站、kindle电子书、PDF电子书、书单书评、外文电子书、杂志漫画、数学古籍、书籍搜索八大类,想看什么直接到那个分类就很方便。
10.书伴虽然kindle退出中国市场了,但仍有不少它的狂热粉。如果你拥有kindle,那这个网站你千万不要错过,里面不仅有免费的电子书资源,还有kindle详细的新手教程、使用技巧、以及相关工具,打开新世界的大门。
11.宝藏电子书库30+职场电子书,全是PDF直接下载!
无套路,还是修正版。包括思维逻辑类、谈话沟通类、团队管理类。直接下载看!
《华为管理法》、《OKR管理法》、《关键对话》等,都是职场人必读必看~
如果对你有帮助的话,请给小编点个赞哦~
关注@伙伴云,持续分享更多书籍网站.......