首页 开发编程 正文

原版php怎么发邮箱

我们将仔细研究如何在Python中使用正则表达式(regex)?可用于自动搜索和替换文本字符串中的元素,并能够使用Pythonregex模块中的基本模式和功能re来分析文本字符串。...

原版php怎么发邮箱,dz论坛邮件设置?

1、到 www.21cn.com 注册一个免费邮箱,用户名可以跟你的网站域名相同或相近。

2、到你的论坛后台,“全局”--“邮件设置”。

3、修改discuz根目录下的config.inc.php文件: 修改:$adminemail = 'gearbbs@21cn.com'; (注意这里一定要修改为你刚才申请的新邮箱地址!!)

你是如何学会正则表达式的?

全力以赴地进入数据集是从事数据科学工作的任何人的使命之一。通常,这意味着要进行数字运算,但是当我们的数据集主要基于文本时,我们该怎么办?我们可以使用正则表达式。在本教程中,我们将仔细研究如何在Python中使用正则表达式(regex)。

正则表达式(regex)本质上是文本模式,可用于自动搜索和替换文本字符串中的元素。这可以使清理和使用基于文本的数据集变得更加容易,从而省去了手动搜索大量文本的麻烦。

正则表达式可以在多种编程语言中使用,并且已经存在很长时间了!

不过,在本教程中,我们将学习Python中的正则表达式,因此需要基本熟悉关键的Python概念,例如if-else语句,while和for循环等。在本教程结束时,您将熟悉Python regex的工作原理,并能够使用Python regex模块中的基本模式和功能re来分析文本字符串。您还将获得有关正则表达式如何与熊猫配合使用以处理大型文本语料库的介绍。

让我们深入研究有关每个人最不喜欢的电子邮件类型的一些数据:垃圾邮件和欺诈。

我们的任务:分析垃圾邮件

在本教程中,我们将使用Kaggle的欺诈电子邮件语料库。它包含1998年至2007年之间发送的数千种网络钓鱼电子邮件。它们非常有趣,易于阅读。

您可以在这里找到完整的语料库。但是,我们将从使用一些电子邮件学习基本的正则表达式命令开始。如果需要,您也可以使用我们的测试文件,也可以在完整的语料库中尝试使用。

介绍Python的Regex模块

首先,我们将通过打开测试文件,将其设置为只读并读取来准备数据集。我们还将其分配给变量fh(用于“文件句柄”)。

请注意,我们在目录路径之前加r。此技术将字符串转换为原始字符串,这有助于避免某些机器读取字符的方式引起的冲突,例如Windows上目录路径中的反斜杠。

现在,假设我们要找出电子邮件的来源。我们可以自己尝试使用原始Python:

但这并没有给我们确切的需求。如果您看一下我们的测试文件,我们可以找出原因并修复它,但是,让我们使用Python的re模块并使用正则表达式来做吧!

我们将从导入Python的re模块开始。然后,我们将使用一个名为的函数re.findall(),该函数返回在正在查看的字符串中定义的模式的所有实例的列表。

外观如下:

这与原始Python的长度基本相同,但这是因为这是一个非常简单的示例。您尝试做的越多,Python正则表达式就可以为您节省更多的精力。

在继续之前,让我们仔细看看re.findall()。此函数采用形式为的两个参数re.findall(pattern, string)。在这里,pattern代表我们要查找的子字符串,并string代表我们要在其中查找的主字符串。主字符串可以包含多行。在这种情况下,我们让它fh使用选定的电子邮件来搜索所有文件。

该.*是一个字符串模式的简写。正则表达式通过使用这些速记模式来查找文本中的特定模式而起作用,因此让我们看一下其他一些常见示例:

常见的Python正则表达式模式

我们re.findall()上面使用的模式包含一个完整拼写的字符串"From:"。当我们确切地知道我们要查找的内容(精确到实际字母以及它们是否为大写或小写)时,这很有用。如果我们不知道我们想要的字符串的确切格式,我们将会迷路。幸运的是,正则表达式具有解决此情况的基本模式。让我们看看在本教程中使用的那些:

1)w匹配字母数字字符,表示az,AZ和0-9。它还与下划线_和破折号-相匹配。

2)d 匹配数字,表示0-9。

3)s 匹配空白字符,包括制表符,换行符,回车符和空格字符。

4)S 匹配非空格字符。

5).匹配除换行符外的任何字符n。

掌握了这些正则表达式模式后,您将在继续进行解释的同时快速理解上面的代码。

使用正则表达式模式

现在,我们可以.*在re.findall("From:.*", text)上面的行中解释的用法。让我们.先来看:

通过在.旁边添加一个From:,我们可以在其旁边查找另一个字符。因为.查找除以外的任何字符n,所以它捕获了我们看不到的空格字符。我们可以尝试更多的点来验证这一点。

看起来加点确实为我们获得了线的其余部分。但是,这很繁琐,而且我们不知道要添加多少点。这是星号符号*出现的位置。

*匹配模式左侧的零个或多个实例。这意味着它将寻找重复模式。当我们寻找重复的模式时,我们说搜索是“贪婪的”。如果我们不寻找重复的模式,则可以将搜索称为“非贪婪”或“懒惰”。

让我们构建一个贪婪的搜索.用*。

因为*匹配在其左侧指示的模式的零个或多个实例,并且.位于此处的左侧,所以我们能够获取From:字段中的所有字符,直到行尾。这将用精美简洁的代码打印出整行。

我们甚至可以更进一步,仅隔离名称。让我们使用它re.findall()来返回包含模式的行列表,"From:.*"就像之前一样。match为了整洁,我们将其分配给变量。接下来,我们将遍历列表。在每个循环中,我们将re.findall再次执行,匹配第一个引号以仅选择名称:

注意,我们在第一个引号旁边使用了反斜杠。反斜杠是一个特殊字符,用于转义其他特殊字符。例如,当我们想将引号用作字符串文字而不是特殊字符时,可以使用反斜杠将其转义,例如:\"。如果我们不使用反斜杠转义上面的模式,它将变为"".*"",Python解释器将其读取为两个空字符串之间的句点和星号。它将产生错误并破坏脚本。因此,至关重要的是我们在这里用反斜杠将引号引起来。

匹配第一个引号后,.*获取行中的所有字符,直到下一个引号也被转义为模式。这使我们得到的名称只是带引号的名称。该名称也打印在方括号中,因为re.findall返回的匹配项在列表中。

如果我们想要电子邮件地址怎么办?

看起来很简单,不是吗?仅模式不同。让我们来看一看。

这是我们仅匹配电子邮件地址的前部分的方式:

电子邮件总是包含一个@符号,因此我们从它开始。电子邮件中@符号前的部分可能包含字母数字字符,这w是必需的。但是,由于某些电子邮件包含句点或破折号,所以这还不够。我们添加S以查找非空白字符。但是,w\S只会得到两个字符。添加*以查找重复。因此,模式的前部如下所示:\w\S*@。

现在查看@符号后面的模式:

域名通常包含字母数字字符,句点和短划线,因此a .可以。为了使它更贪婪,我们使用扩展了搜索范围*。这使我们可以匹配任何字符,直到行尾。

如果我们仔细观察这条线,会发现每封电子邮件都封装在尖括号<和>中。我们的模式.*包括右括号>。让我们对其进行补救:

电子邮件地址以字母数字字符结尾,因此我们将模式设置为w。因此,在@符号后面有.*\w,这表示我们想要的模式是一组以字母数字字符结尾的任何类型的字符。不包括>。

因此,我们的完整电子邮件地址格式如下所示:\w\S*@.*\w。

!这需要花费很多时间。接下来,我们将介绍一些通用re功能,这些功能在开始重新组织语料库时将非常有用。

常用的Python正则表达式函数

re.findall()无疑是有用的,但它不是我们可以使用的唯一内置函数re:

1)re.search()

2)re.split()

3)re.sub()

在使用它们为我们的数据集添加一些顺序之前,让我们一一看一下。

研究()

While re.findall()匹配字符串中某个模式的所有实例并在列表中返回它们,re.search()匹配字符串中一个模式的第一个实例,并将其作为re匹配对象返回。

像一样re.findall(),re.search()也有两个参数。第一个是要匹配的模式,第二个是要在其中找到模式的字符串。在这里,我们将结果分配给match变量以保持整洁。

由于re.search()返回re匹配对象,因此无法通过直接打印来显示名称和电子邮件地址。相反,我们必须首先对该group()函数应用该函数。我们已经在上面的代码中打印了这两种类型。如我们所见,group()将match对象转换为字符串。

我们还可以看到,打印match显示的属性超出字符串本身,而打印match.group()仅显示字符串。

re.split()

假设我们需要一种快速的方法来获取电子邮件地址的域名。我们可以通过三个正则表达式操作来做到这一点,如下所示:

第一行很熟悉。我们返回一个字符串列表,每个字符串包含From:字段的内容,并将其分配给变量。接下来,我们遍历列表以查找电子邮件地址。同时,我们循环访问电子邮件地址,并使用该re模块的split()功能将每个地址切成两半,用@符号作为分隔符。最后,我们打印它。

re.sub()

另一个方便的re功能是re.sub()。就像函数名称所暗示的那样,它替换字符串的一部分。一个例子:

我们之前已经在第一行和第二行看到了任务。在第三行,我们re.sub()在上应用address,这是From:电子邮件标题中的完整字段。

re.sub()需要三个参数。第一个是要替换的子字符串,第二个是我们要替换的字符串,第三个是主字符串本身。

正则表达式与pandas

现在,我们掌握了Python正则表达式的基础知识。但是通常对于数据任务,我们实际上并没有使用原始的Python,而是使用了pandas库。现在,将我们的正则表达式技能带入熊猫工作流程,将其提升到一个新的水平。

如果您以前从未使用过熊猫,请不要担心。我们将逐步遍历代码,以免您迷路。但是,如果您想更详细地了解熊猫,请查看我们的熊猫教程或我们提供的有关numpy和熊猫的完全交互式课程。

使用Python Regex和Pandas对电子邮件进行排序

我们的语料库是一个包含数千封电子邮件的单个文本文件(不过,同样,在本教程中,我们使用的是一个只有两个电子邮件的较小文件,因为在整个语料库上打印正则表达式工作的结果会使这篇文章过长)。

我们将使用正则表达式和熊猫将每封电子邮件的各个部分分类为适当的类别,以便可以更轻松地阅读或分析语料库。

我们将每封电子邮件分为以下类别:

1)sender_name

2)sender_address

3)recipient_address

4)recipient_name

5)date_sent

6)subject

7)email_body

这些类别中的每一个都将成为我们的熊猫数据框(即我们的表格)中的一列。这将使我们更轻松地分别处理和分析每个列。

我们将继续处理我们的小样本,但是值得重申的是,正则表达式使我们可以编写更简洁的代码。简洁的代码减少了我们的机器必须执行的操作数量,从而加快了我们的分析过程。使用我们的两封电子邮件的小文件,并没有太大的区别,但是,如果您尝试使用和不使用正则表达式来处理整个语料库,您将开始看到其优势!

准备脚本

首先,让我们导入所需的库,然后再次打开文件。

除了re和之外pandas,我们email还将导入Python的软件包,这将有助于电子邮件的正文。仅使用正则表达式时,电子邮件的主体相当复杂。它甚至可能需要足够的清理才能保证有自己的教程。因此,我们将使用完善的email软件包来节省一些时间,让我们专注于学习正则表达式。

我们还创建了一个空列表emails,用于存储字典。每本词典将包含每封电子邮件的详细信息。

现在,让我们开始应用正则表达式!

注意:为简洁起见,我们剪裁了上面的打印输出。如果您在自己的机器上打印此文件,它将显示其中包含的所有内容,contents而不是...像上面那样结束。

我们使用re模块的split函数将整个文本块分割fh为单独的电子邮件列表,然后将其分配给变量contents。这很重要,因为我们希望通过使用for循环遍历列表来逐一处理电子邮件。但是,我们如何知道按字符串分割"From r"?

我们之所以知道这一点,是因为在编写脚本之前我们已经查看了文件。我们不必细读其中的数千封电子邮件。只是前几个,看看数据的结构是什么样子。只要有可能,最好在开始使用代码之前先关注实际数据,因为您经常会发现诸如此类的有用功能。

我们已经截取了原始文本文件的屏幕截图:

电子邮件以“ From r”开头

绿色方框是第一封电子邮件。蓝色方框是第二封电子邮件。如我们所见,这两封电子邮件均以开头"From r",并以红色框突出显示。

我们在本教程中使用欺诈电子邮件语料库的原因之一是,当数据杂乱无章,不熟悉且没有文档时,我们不能仅仅依靠代码来整理数据。这将需要一双人眼。正如我们刚刚显示的,我们必须研究语料库本身以研究其结构。

像这样杂乱无章的数据可能需要大量清理。例如,即使我们使用本教程将要构建的完整脚本来计算此集合中的3977封电子邮件,但实际上还有更多。某些电子邮件实际上并不以开头"From r",因此不会单独计算。(不过,为了简洁起见,我们将继续处理该问题,并用分隔所有电子邮件"From r"。)

还要注意,我们contents.pop(0)用来摆脱列表中的第一个元素。这是因为"From r"字符串在第一封电子邮件之前。拆分该字符串后,它将在索引0处生成一个空字符串。我们将要编写的脚本是为电子邮件设计的。如果我们尝试在空字符串上使用它,则可能会引发错误。摆脱空字符串可以使我们避免破坏脚本。

使用For循环获取每个名称和地址

接下来,我们将使用contents列表中的电子邮件。

在上面的代码中,我们使用for循环来遍历,contents因此我们可以依次处理每封电子邮件。我们创建了一个词典,emails_dict其中包含每封电子邮件的所有详细信息,例如发件人的地址和姓名。实际上,这些是我们发现的第一批物品。

这是一个三步过程。首先从寻找From:领域开始。

在第1步中,我们From:使用re.search()函数查找整个字段。该.装置除了任何字符n,并且*其延伸到行的结尾。然后,我们将其分配给变量sender。

但是,数据并不总是那么简单。它可能包含惊喜。例如,如果没有From:字段怎么办?该脚本将引发错误并中断。我们在步骤2中避免了这种情况下的错误。

为了避免由于缺少From:字段而导致的错误,我们使用一条if语句来检查sendernot None。如果是,我们分配s_email和s_name的值,None以便脚本可以继续运行而不是意外中断。

如果您在自己的文件中使用本教程,则可能已经意识到使用正则表达式会变得混乱。例如,这些if-else语句是在编写主体时对主体使用反复试验的结果。编写代码是一个反复的过程。值得注意的是,即使本教程看起来很简单,实际实践也需要进行更多的实验。

在第2步中,我们使用之前的regex模式\w\S*@.*\w,该模式与电子邮件地址匹配。

我们将对名称使用其他策略。每个名称都由左侧:子字符串的冒号()"From:"和<右侧电子邮件地址的左尖括号()界定。因此,我们使用它:.*<来查找名称。我们摆脱:并<从每个结果的时刻。

现在,让我们打印出代码的结果以查看它们的外观。

同样,我们有匹配对象。每次我们将re.search()字符串应用于字符串时,都会生成匹配对象。我们必须将它们变成字符串对象。

我们这样做之前,记得,如果没有From:现场,sender将具有的价值None,因此也将s_email和s_name。因此,我们必须再次检查这种情况,以便脚本不会意外中断。让我们看看如何首先构建代码s_email。

在步骤3A中,我们使用一条if语句检查s_emailnot None,否则它将引发错误并破坏脚本。

然后,我们只需将s_emailmatch对象转换为字符串并将其分配给sender_email变量。我们将其添加到emails_dict字典中,这将使我们日后将细节转换为pandas数据框变得异常容易。

我们s_name在步骤3B中所做的几乎完全相同。

正如我们以前那样,我们首先检查s_name是不是None在步骤3B。

然后,在将字符串分配给变量之前,我们两次使用re模块的re.sub()函数。首先,我们删除冒号和它与名称之间的所有空白字符。我们:s*用一个空字符串代替""。然后,我们删除空格字符和名称另一边的尖括号,再次用空字符串替换它。最后,在将字符串分配给之后sender_name,我们将其添加到字典中。

让我们检查一下结果。

完善。我们已经隔离了电子邮件地址和发件人的姓名。我们还将它们添加到字典中,该字典将很快投入使用。

现在我们已经找到了发件人的电子邮件地址和名称,我们将执行完全相同的步骤来获取字典的收件人的电子邮件地址和名称。

首先,我们找到To:领域。

接下来,我们抢先在场景recipient是None。

如果recipient不是None,则用于re.search()查找包含电子邮件地址和收件人姓名的匹配对象。否则,我们传递r_email和r_name的值None。

然后,将匹配对象转换为字符串并将其添加到字典中。

由于From:和To:字段的结构相同,因此我们可以对两者使用相同的代码。我们需要为其他字段定制略有不同的代码。

获取电子邮件的日期

现在确定发送电子邮件的日期。

我们Date:为From:和To:字段获取具有相同代码的字段。

并且,就像我们对这两个字段所做的一样,我们检查Date:分配给date_field变量的字段是否不是None。

我们已经打印了出来,date_field.group()以便我们可以更清楚地看到字符串的结构。它包括日期,DD MMM YYYY格式的日期和时间。我们只想要日期。日期的代码与姓名和电子邮件地址基本相同,但更为简单。也许唯一令人困惑的是正则表达式模式\d+\s\w+\s\d+。

日期以数字开头。因此,我们用d它来解释它。但是,作为日期的DD部分,它可以是一位或两位数字。在这里+变得重要。在Python正则表达式中,+匹配其左侧1个或多个模式实例。d+因此,无论日期是DD还是一两位数字,它都将与日期的DD部分匹配。

在那之后,有一个空间。这是由占的s,它查找空白字符。因此,该月由三个字母组成w+。然后它撞到另一个空间s。年份由数字组成,因此我们d+再次使用。

完整模式\d+\s\w+\s\d+起作用的原因是它是一个精确的模式,在两侧均以空格字符为界。

接下来,我们None像以前一样检查值。

如果date不是None,则将其从匹配对象转换为字符串,并将其分配给变量date_sent。然后,将其插入字典中。

在继续之前,我们应该注意一个关键点。+并且*看起来相似,但它们可以产生非常不同的结果。让我们以日期字符串为例。

如果使用*,则将匹配零个或多个匹配项。+匹配一个或多个事件。我们已经打印了两种情况的结果。有很大的不同。如您所见,+获取完整日期,而*获取空格和数字31。

接下来,是电子邮件的主题行。

获取电子邮件主题

和以前一样,我们使用相同的代码和代码结构来获取所需的信息。

现在我们对Python正则表达式的使用越来越熟悉了,不是吗?它与以前的代码大致相同,不同之处在于,我们"Subject: "用空字符串代替仅获取主题本身。

获取电子邮件的正文

要插入字典的最后一项是电子邮件的正文。

将标头与电子邮件正文分开是一项非常复杂的任务,尤其是当许多标头以一种或另一种方式不同时。在原始的无组织数据中很少发现一致性。对我们来说幸运的是,这项工作已经完成。Python的email软件包非常擅长此任务。

请记住,我们已经较早导入了该软件包。现在,我们将其message_from_string()功能应用于item,以将完整的电子邮件转换为emailMessage对象。Message对象由标头和有效负载组成,它们分别对应于电子邮件的标头和正文。

接下来,我们将其get_payload()功能应用于Message对象。此功能隔离电子邮件的正文。我们将其分配给变量body,然后将其插入到emails_dict键下的字典中"email_body"。

为什么使用电子邮件软件包而不是正文

您可能会问,为什么使用emailPython软件包而不是regex?这是因为目前还没有很好的方法来处理Python正则表达式,而这不需要大量的清理工作。这意味着可能需要另外一份教程。

值得检查一下我们如何做出这样的决定。但是,我们需要先了解[ ]正则表达式中的方括号,然后才能这样做。

[ ]匹配放置在其中的任何字符。例如,如果我们要查找"a","b"或"c"字符串,则可以将其[abc]用作模式。我们上面讨论的模式也适用。[\w\s]会找到字母数字或空格字符。例外是.,它成为方括号内的文字周期。

现在,我们可以更好地了解我们是如何决定使用电子邮件软件包的。

窥视数据集可发现电子邮件标题在字符串"Status: 0"或处停止"Status: R0",并"From r"在下一封电子邮件的字符串前结束。因此,我们可以Status:\s*\w*\n*[\s\S]*From\sr*用来仅获取电子邮件正文。[\s\S]*适用于大块的文本,数字和标点符号,因为它可以搜索空白或非空白字符。

不幸的是,有些电子邮件包含多个"Status:"字符串,而另一些则不包含"From r",这意味着我们会将电子邮件拆分成多于或少于电子邮件列表中词典的数量。它们与我们已经拥有的其他类别不匹配。使用熊猫时,这会产生问题。因此,我们决定利用该email软件包。

创建词典列表

最后,将字典追加emails_dict到emails列表中:

我们可能要emails在此时打印列表以查看其外观。如果您只是一直在使用我们的小样本文件,那么这将是反高潮的,但是在整个语料库中,您将看到正则表达式的强大功能!

我们还可以print(len(emails_dict))查看列表中有多少个词典,因此还有电子邮件。如前所述,整个语料库包含3977。

这是完整的代码:

如果使用我们的示例文本文件运行它,将会得到以下结果:

我们已经打印出emails列表中的第一项,它显然是带有键和值对的字典。因为我们使用了for循环,所以每个字典都具有相同的键但值不同。

我们已替换为item,"email content here"以便我们不会打印出电子邮件的全部内容并阻塞屏幕。如果您要使用实际数据集在家打印此文件,则会看到整个电子邮件。

用熊猫处理数据

有了列表中的词典,我们使熊猫图书馆的工作变得无比轻松。每个键将成为列标题,每个值将成为该列中的一行。

我们要做的就是应用以下代码:

通过这一行,我们emails使用pandas DataFrame()函数将字典列表转换为数据框。我们也将其分配给变量。

而已。现在,我们有了一个复杂的熊猫数据框。这实际上是一个整洁的表格,其中包含我们从电子邮件中提取的所有信息。

让我们看一下前几行。

该dataframe.head()函数仅显示前几行,而不显示整个数据集。这需要一个论点。一个可选参数允许我们指定要显示多少行。在这里,n=3让我们查看三行。

我们还可以精确地找到我们想要的东西。例如,我们可以找到从特定域名发送的所有电子邮件。但是,让我们学习一种新的正则表达式模式,以提高找到所需项目的精度。

管道符号会|在其任一侧寻找字符。例如,a|b寻找a或b。

|可能看起来与相同[ ],但是它们确实有所不同。假设我们要匹配要么"crab","lobster"或"isopod"。大数据分析Python的正则表达式Regular Expressions使用方法https://www.aaa-cg.com.cn/data/2301.html使用crab|lobster|isopod会比有意义[crablobsterisopod],不是吗?前者将寻找每个单词,而后者将寻找每个字母。

现在,我们|来查找从一个或另一个域名发送的所有电子邮件。

我们在这里使用了相当长的代码。让我们从内而外开始。

emails_df['sender_email']选择标记为的列sender_email。接下来,str.contains(epatra|spinfinder)返回True是否在该列中找到子字符串"epatra"或"spinfinder"。最后,外部emails_df[]返回行的视图,其中该sender_email列包含目标子字符串。好漂亮!

我们也可以查看来自各个单元的电子邮件。为此,我们经历了四个步骤。在步骤1中,我们找到"sender_email"列包含字符串的行的索引"@spinfinder"。注意我们如何使用正则表达式来执行此操作。

在步骤2中,我们使用索引查找电子邮件地址,该loc[]方法作为具有多个不同属性的Series对象返回该电子邮件地址。我们在下面将其打印出来以查看其外观。

在第3步中,我们从系列对象中提取电子邮件地址,就像从列表中提取项目一样。您可以看到它的类型现在是class。

步骤4是提取电子邮件正文的位置。

在步骤4中,emails_df['sender_email'] == "bensul2004nng@spinfinder.com"找到该sender_email列包含value 的行"bensul2004nng@spinfinder.com"。接下来,['email_body'].values查找email_body同一行中的列的值。最后,我们打印出该值。

如您所见,我们可以通过多种方式使用正则表达式,它也可以与大熊猫一起使用!如果您的正则表达式工作包含大量的反复试验,请不要气,,尤其是在您刚刚入门时!

其他资源

自从几年前正则表达式从生物学跃升为工程学以来,正则表达式已取得了巨大的发展。如今,正则表达式已在不同的编程语言中使用,其中除了其基本模式之外还有一些变体。我们已经学习了很多Python正则表达式,并且如果您想将它提高到一个新的水平,那么我们的Python数据清理高级课程可能是一个不错的选择。

您还可以在官方参考资料中找到一些帮助,例如Python 有关其模块的文档re。Google有更快的参考资料。

如果您愿意,也可以开始探索Python regex与其他形式的regex Stack Overflow帖子之间的区别。

如果您需要数据集进行试验,则Kaggle和StatsModels很有用。

最后,这是我们制作的Regex速查表,它也非常有用。

https://www.toutiao.com/i6829923957647344142/

最良心的软件可以良心到什么程度?

Geek/卸载工具

平时大家基本都会用控制面板对应用进行卸载,然而这种方法有两个弊端:无法卸载顽固应用、无法清理卸载后的残留文件。

「Geek uninstaller」这款卸载小工具就很好的解决了上述两个问题,而且大小仅6MB,几乎不占用内存。它具有许多出众的功能,从而可以保证卸载无残留,系统运行速度也不会有丝毫下降,而且还有强制卸载的功能!自带多国语言文件,支持中文。

选中需要卸载的应用程序,大家可以对所选应用进行卸载、强制删除、打开软件安装目录等操作。

Recuva/文件恢复工具

可以为用户恢复任何电脑上被删除了的文件,甚至,就连U盘、等设备的文件也能够恢复。

大到视频、音乐、压缩包,小到图片、文本、邮件,几乎能恢复所有丢失的文件。

Everthing/搜索工具

你是否有过为了寻找一份以前完成的文档、看过的文献而查找了好几个小时的郁闷经历;你是否有过为了实现检索文件而更换成了高大上的win7或win8;事实上,仅需要一款简便的搜索工具即可解决你的烦恼。

「Everthing」的搜索工具可以立马搜索到你需要的文件,并且能够快速找到文件所在路径。

除此之外,顶部任务栏中还有非常多的实用功能与设置,方便用户在使用过程中能够获得更高效的体验。

Listary/搜索工具

「Listary」是一款文件名定位搜索工具(和Everthing类似),他打破了传统低效率的搜索方式。

通过连按两下Ctrl键的方式,可以快速调出搜索栏,搜索你需要的文件。搜索栏右侧含有收藏夹、搜索历史等功能,极大的提升了文件搜索效率。

Listen1/听音乐

喜欢听歌的小伙伴们一定会有一个困扰,由于版权问题,所有音乐平台中的曲库都是有限的。

所以大家在听歌时往往需要在多个音乐平台之间来回切换,非常不方便。

这个时候一定要去试试「Listen1」可以搜索和播放来自网易云音乐,虾米,QQ音乐,酷狗音乐,酷我音乐网站的歌曲,让你的曲库更全面。

火绒安全/安全软件

最值得推荐的一款安全软件:无弹窗、无广告、无劫持、无捆绑。

火绒是一款杀防一体的安全软件。全新的界面,丰富的功能,完美的体验。特别针对国内安全趋势,自主研发高性能病毒通杀引擎,由前瑞星核心研发成员打造,拥有十年以上网络安全经验。

用不惯Windows Defender的同学可以试试火绒哦!

扩展工具栏中点哥最常用的就是「弹窗拦截」功能,他能自动检测软件中所存在的弹窗,若是遇到隐藏比较深的弹窗,可以手动添加拦截。

CCleaner/垃圾清理工具

电脑使用久了多多少少会堆积很多垃圾文件和各种错误文件。

想对电脑进行一次彻底的清理?不妨试试「CCleaner」,一款完全免费且评价很高的系统垃圾清理工具!CCleaner可以从您的系统中搜索并清除无用的文件和垃圾文件,让您的 Windows 运行更快、更有效率、释放出更多的硬盘空间。

小黄条/备忘工具

办公好拍档,一款极为小巧简便且免费的桌面便签记事备忘工具,它能让你随手地往 Windows 桌面贴上清新、直观且颇有感觉的“便签”,让你「一打开电脑就知道该做什么事了」!而且小黄条便签还支持与 iOS、Android 安卓同步,让你随时随地都能查看和使用你的待办事项清单……

Wise Folder Hider

相信很多小伙伴们的电脑中肯定有一些重要的学习资料急需加密吧!

给大家推荐一款非常好用且免费的文件加密神器「Wise Folder Hider」。

它可以将一些较为私密的文件、照片、视频等内容进行隐藏加密。

使用方法也非常容易:打开软件会提示你设置密码,密码设置完成后,只需将文件拖拽至软件中就能完成加密。

Smallpdf/PDF转换

(https://smallpdf.com/)

该网站据说是全世界浏览人数最多的PDF转换网站,网站中含18种PDF相关的转换方式及工具。

不仅支持将PDF转换成Word、PPT、Excel、图片等格式,还能为PDF添加保护密码,重新编辑PDF,删除PDF页面等。

以上均是亲自试用、筛选的绝赞优质软件,相信一定有一款能够和你心意~

PHP可以自学吗?

黑马程序员搭建环境

PHP简介什么是PHP

PHP定义:一种服务器端的 HTML 脚本/编程语言,是一种简单的、面向对象的、解释型的、健壮的、安全的、性能非常之高的、独立于架构的、可移植的、动态的脚本语言。是一种广泛用于 Open Source(开放源代码)的尤其适合 Web 开发并可以嵌入 HTML 的多用途脚本语言。它的语法接近 C,Java 和 Perl,而且容易学习。该语言让 Web 开发人员快速的书写动态生成的网页。PHP前身:Personal HomePage,个人主页,使用Perl语言开发的一种写个人主页的语言PHP:PHP Hypertext Preprosessor,php超文本预处理器,底层使用C语言

PHP发展史

Rasmus Lerdorf :创建者1994:1.0,个人perl,非常简单(简陋)1996:2.0,C底层,变的相对比较强大1998:3.0,zendEngine,联合zend公司共同管理和维护PHP,zendEngine(zend引擎)用户高效的解析php代码2000:4.0,session+输出缓冲等,session技术(会话技术),2004:5.0,zend引擎2代,增加新技术(面向对象更新,命名空间,异常)2015:7.0,新版的ZendEngine引擎,性能提升,新特性(异常)平台支持(window,Linux,UNIX)数据库支持(Sqlserver,mysql,Oracle,Access)

静态网站与动态网站的区别

静态网站:web1.0时代动态网站:web2.0时代

网站

Website的中文名称是网站,是指在互联网上,根据一定的规则,使用HTML、PHP等代码语言制作的用于展示特定内容的相关网页的集合,有可供管理人员操作的后台及用户使用的前台。简单地说,Website是一种通讯工具,就像布告栏一样,人们可以通过Website来发布自己想要公开的资讯,或者利用Website来提供相关的网络服务。人们可以通过网页浏览器来访问Website,获取自己需要的资讯或者享受网络服务。

静态网站特点

1.网页内容一经发布到网站服务器上,无论是否有用户访问,每个静态网页的内容都是保存在网站服务器上的,也就是说,静态网页是实实在在保存在服务器上的文件,每个网页都是一个独立的文件;2.静态网页的内容相对稳定,因此容易被搜索引擎检索;3.静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时完全依靠静态网页制作方式比较困难;4.静态网页的交互性较差,在功能方面有较大的限制。

动态网站特点

1.交互性:网页会根据用户的要求和选择而动态地改变和响应,浏览器作为客户端,成为一个动态交流的桥梁,动态网页的交互性也是今后Web发展的潮流。2.自动更新:即无须手动更新HTML文档,便会自动生成新页面,可以大大节省工作量。3.因时因人而变:即当不同时间、不同用户访问同一网址时会出现不同页面。此外动态网页是与静态网页相对应的,也就是说,网页URL的后缀不是.htm、.html、.shtml、.xml等静态网页的常见形式,而是以.asp、.jsp、.php、.perl、.cgi等形式为后缀。在动态网页网址中有一个标志性的符号——“?”

网站基本概念服务器概念

服务器(server),也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。服务器的构成包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。在网络环境下,根据服务器提供的服务类型不同,分为文件服务器,数据库服务器,应用程序服务器,WEB服务器等。服务器:能够提供服务的机器,取决于机器上所安装的软件(服务软件)Web服务器:提供web服务(网站访问),就需要安装web服务软件,Apache,tomcat,iis等

IP的概念

IP:Internet Protocol,网络之间互联协议。网络之间互连的协议也就是为计算机网络相互连接进行通信而设计的协议。在因特网中,它是能使连接到网上的所有计算机网络实现相互通信的一套规则,规定了计算机在因特网上进行通信时应当遵守的规则。任何厂家生产的计算机系统,只要遵守IP协议就可以与因特网互连互通。IP地址具有唯一性。(每台电脑都有一个唯一的IP地址)

域名

域名(Domain Name),是由一串用点分隔的名字组成(www.itcast.cn)的Internet上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置,地理上的域名,指代有行政自主权的一个地方区域)。域名是一个IP地址上有“面具” 。一个域名的目的是便于记忆和沟通的一组服务器的地址(网站,电子邮件,FTP等)。域名作为力所能及难忘的互联网参与者的名称。特殊IP:127.0.0.1,代表本机特殊域名:localhost

DNS

DNS(Domain Name System,域名系统),因特网上作为域名和IP地址相互映射的一个分布式数据库,能够使用户更方便的访问互联网,而不用去记住能够被机器直接读取的IP数串。通过主机名,最终得到该主机名对应的IP地址的过程叫做域名解析(或主机名解析)。用户输入域名localhost—》DNS(localhost 127.0.0.1)--》服务器电脑

端口

端口(Port),可以认为是设备与外界通讯交流的出口。端口可分为虚拟端口和物理端口,其中虚拟端口指计算机内部或交换机路由器内的端口,不可见。例如计算机中的80端口、21端口、23端口等。物理端口又称为接口,是可见端口,计算机背板的RJ45网口,交换机路由器集线器等RJ45端口。用户输入域名localhost:端口—》DNS(localhost 127.0.0.1)--》服务器电脑—》软件(服务)

Web程序的访问流程

Web分为两类:静态网站和动态网站浏览器发起访问—》DNS解析域名—》服务器电脑---》服务软件

静态网站访问

动态网站访问

动态网站访问流程与静态差不多,但是会多出几个内容:服务器端解析、数据库

安装Apache安装Apache软件

1、 获取Apache安装软件2、 双击安装即可:指定对应的路径:E:server/apache3、选择安装模式:使用自定义模式4、 选择安装位置

Apache的目录结构说明

Httpd.exe的详细应用

1、 服务器进程:运行之后才能够工作2、 用来查看Apache具有哪些功能以及配置文件是否有错:httpd或者httpd.exe(文件所在目录)2.1 查看使用的模块:httpd -M2.2 验证配置文件是否有效:httpd –t

配置默认站点

1、 让Apache确定服务器上访问的位置:网站文件夹所在位置Httpd.conf:DocumentRoot2、 方便用户使用名字访问对应的网站:给文件夹对应的取一个别名Httpd.conf:ServerName端口可以单独实现:httpd.conf:listen3、 凡是涉及到Apache配置文件的修改,那么需要重启Apache才能生效4、 实现DNS域名解析:通常默认站点都是本地DNS:hosts文件

安装与配置PHP安装PHP语言

1、 获取PHP安装文件:建议去官网2、 解压缩3、 安装:将解压后的文件放到E:/server/,重命名PHP5

PHP的目录结构说明

php.exe的应用

PHP.exe就是可以解析PHP代码转变成HTML代码从而让浏览器可以解析的。1、 通过CMD控制器进入到php.exe所在目录2、 通过php.exe运行命令来指定要解析的PHP脚本就可以:php.exe -f PHP文件所在路径

配置Apache加载PHP模块

1、 Apache加载PHP模块:在Apache的主配置文件(httpd.conf)中加载对应的PHP提供的模块LoadModule php5_module PHP所提供的模块链接所在路径2、 Apache分配工作给PHP模块:如果是PHP代码就交给PHP处理:文件后缀判断.php结尾肯定是PHP代码AddType application/x-httpd-php .php3、 将PHP的配置文件加载到Apache配置文件中:共同生效3.1 在Apache中指定PHP配置文件所在路径PHPIniDir php.ini所在路径3.2 php.ini文件默认是不存在的,是以development和production格式存在,需要格式化说明:PHP的配置文件已经加入到Apache的配置项中,意味着php.ini的修改需要Apache重启才会生效。

安装与配置MySQL安装MySQL软件

1、 获取MySQL安装软件2、 双击安装即可:没有特殊情况的直接下一步就可以完成3、 选择custom,自定义安装:选择安装路径3.1 软件安装目录:server/mysql3.2 数据安装目录:server/mysql/data4、 在完成安装之后,要实现配置5、 选择详细配置(默认的)6、 选择开发环境:默认的7、 选择功能:默认8、 并发设置(建议手动)9、 配置访问环境10、 字符集设定:系统字符集11、 服务安装:将MySQL作为windows下的一个服务启动12、 输入root(超级管理员)的用户密码13、 等待配置:4个都是勾表示安装成功

MySQL的目录结构说明 Bin目录的常用命令

软件设计结构:C/S和B/SC/S:Client客户端/Server服务端,用户需要安装客户端产品才能访问服务器,而且只能访问一种软件(当前自己)B/S:Browser浏览器/Server服务端,用户只需要安装浏览器,就可以访问所有的服务器(B/S架构服务)

MySQL的访问流程

Mysql是一款C/S架构的软件,需要通过客户端来访问服务端(MySQL提示也提供了其他模式的访问:通过一些插件扩展来充当客户端)1、 启用MySQL客户端:mysql.exe,该软件本身可以通过CMD控制台运行本身客户端:mysql.exeMysql.exe通过cmd运行2、 MySQL客户端访问服务端需要进行寻找匹配:连接认证连接:IP和端口确认,如果是本地都可以省略-h主机地址----》-hlocalhost(可以是IP)-P端口---》-P3306认证:通过用户名和密码进入服务器-u用户名---》-uroot,不可以省略(匿名用户除外)-p密码---》-proot3、 退出命名:\q注意:通常连接认证的时候密码不建议明文,可以在输入-p之后回车,系统会再次让输入密码,这个时候就是密文

PHP连接MySQL数据库

PHP本身不具备操作MySQL数据库的能力,需要借助PHP操作MySQL的扩展来实现。1、 PHP加载MySQL扩展:php.ini文件中2、 PHP中所有的扩展都是在ext文件夹中,需要制定扩展所在路径:extension_dir3、 php.ini已经被Apache加载,所以需要重启才会生效。

设定PHP的系统时区

通过php.ini中的timezone配置项来实现

配置虚拟主机

一台服务器很贵,如果只能部署一个网站,那么非常浪费。所以需要通过其他渠道来实现一台主机上部署多个网站。

什么是虚拟主机

虚拟主机:Virtual machine,并不存在真实的主机,但是可以提供真实主机所实现的功能。通俗的讲,虚拟主机就是将计算机中不同的文件夹进行不同的命名,然后可以实现让服务器(Apache)根据用户的需求从不同的文件夹(网站)中读取不同的内容。

虚拟主机的分类

在Apache中,可以将虚拟主机划分成两类:1、 基于IP的虚拟主机:一台电脑上有多个IP,每个IP对应一个网站原理:电脑默认只有一个IP,因为通常只配有一个网卡;但是有的电脑(服务器居多)可以配置多个网卡,每个网卡可以绑定一个IP地址。2、 基于域名的虚拟主机:一台电脑上只有一个IP,但是IP下可以制作多个网站,但是需要给每个网站不同的名字(虚拟主机名)

搭建基于域名的虚拟主机

在Apache中,虚拟主机的搭建有两种方式:1、 在主配置文件中搭建:需要手动开启虚拟主机(基于域名)NameVirtualHost *:802、 在专门的虚拟主机配置文件中配置2.1 在主配置文件中加载虚拟主机配置文件(httpd.conf):虚拟主机配置文件已经开启了虚拟主机NameVirtualHost2.2 虚拟主机从配置文件(extra/httpd-vhosts.conf)中配置虚拟主机①增加一个对应的站点文件夹位置:DocumentRoot②增加主机名字:文件夹的别名:ServerName③ 增加域名解析DNS:hosts④需要给当前设定的站点(目录)访问权限<Directory ‘站点目录’>Order Deny,Allow //没有顺序关系:实际顺序有意义Deny from 指定的范围Allow from 指定范围/all</Directory>⑤ 配置访问列表:当访问是一个目录时候(没有指定具体要访问的文件)Options Indexes [FollowSymLinks],如果访问目录,那么列表显示所有文件⑥ 当用户访问指定目录不指定文件的时候,通常需要系统指定一个默认文件DirectoryIndex 默认的文件列表,使用空格分离注意:如果说网站中整个网站根目录允许访问,但是其中还有其他文件夹不允许访问:可以增加多个Directory标签,针对不同的文件夹3、 一旦启用虚拟主机配置文件,那么默认的主机地址localhost就不再生效,如果想要生效:为localhost增加单独的虚拟主机

小程序自己怎么开发?

因为微信小程序开发成本低、难度小,又天生自带流量优势,依托微信10亿+流量,便于做小程序推广,所以微信小程序受到越来越多企业商家的青睐,纷纷接入微信小程序。那微信小程序的制作流程如何?商家又如何开发微信小程序?我们从微信小程序的注册到发布上线进行全流程阐述。

通过第三方平台制作小程序,成本很低、操作简单,能够快速完成小程序的制作。适用于对小程序定制要求不高,没有开发团队、没有技术经验的中小型企业和个体商户。

小程序开发制作的基本流程1、注册小程序;2、选择第三方平台;3、制作微信小程序;4、授权小程序;5、发布小程序、微信审核。小程序开发流程详解1、注册小程序1>注册小程序账号商家去微信公众平台官网,进行注册,填写账号信息,注册一个小程序账号。使用邮箱激活公众平台账号,完成注册。

商家根据选择的主体类型填写信息,填写信息无误后,用管理员本人微信扫描二维码,验证小程序管理员。验证成功后,提交信息。

2>完成主体认证商家根据自己的主体类型,完善主体信息和管理员信息。小程序仅开放给主体类型为公司的商家,暂不开放给个人。企业类型账号可以通过两种方式完成认证:①用公司的对公账户向腾讯公司打款来验证主体身份;②通过微信认证验证主体身份,需支付300元认证费。

如果小程序已跟公众号关联,也可以用认证过的公众号复用资质认证小程序。

3>开通支付功能有些商家在运营小程序时需要进行线上支付,因此此类商家必须开通小程序支付功能。登录微信公众平台,点击微信支付,按照要求填写基本信息、商户信息和结算用户,确认信息无误后点击提交。2、选择第三方平台企业商家可以通过“得有店”来制作自己的小程序,无需任何技术,人人都可以自主搭建自己的小程序店铺,也可以免费生成公众号H5微商城。得有店团队具备十余年的互联网产品研发技术和经验,专业的技术团队保证得有店系统的永久持续更新升级,客服团队能够全面协助商家开通公众号、小程序、支付等账户,还持续提供运营方法,协助商家将运营落地实施。3、基于平台制作小程序进入得有店官网注册账号并登录,按步骤填写信息创建店铺,可以一键使用行业标配主题模板,也可以通过组件自主拖拽设计店铺风格,操作简单,省时省心。各个行业的商家都能够通过得有店来快速搭建适合自己业务需求的线上商城,可以进行店铺管理、商品的上下架、交易、支付、订单处理、客户管理等,开展拼团、秒杀、砍价、分销、优惠券、满减等线上或线下的营销活动。

得有店提供同城快递自动呼叫、电子面单、小票打印、客服聊天、到店自提、到店核销、服务预约、物流快递、预收费等辅助交易的工具,商家制作的是一款完善的小程序商业经营系统。

4、授权小程序

完成店铺搭建后,将得有店授权给微信小程序,允许得有店调用微信小程序相关接口权限。在得有店上设置小程序支付方式,微信小程序管理员完成支付认证,小程序授权成功。

5、微信审核在得有店系统后台点击发布小程序,提交微信审核,审核成功后,小程序上线。

本文转载自互联网,如有侵权,联系删除